New「プロフィール&ブログコンセプト」

ブログの成長(PV数)を単回帰分析で予測、スプレッドシートでやってみる。

こんな方にオススメ記事!
  • 単回帰分析で何ができるか知りたい方
  • スプレッドシートでの実行方法を知りたい方
  • 過去のデータから未来予測を出したい方

本記事では、当ブログの2020年10月~2021年6月の月間PV数と記事数から単回帰分析を使って月間10,000PVに必要な記事数を予測していこうと思います。

目次

単回帰分析とは?

「単回帰分析」とは、蓄積されたデータをもとに、変数の関係を y = ax + b の式に落とし込む統計手法です。

具体的には、以下の例を見ていただくのがわかりやすいです。

記事数と月間PV数の関係性を表す散布図です。記事数が増える毎にPV数が増える関係性が見てとれます。

散布図:記事数と月間PV数

このプロットされた実測値と最も誤差が少ない線を導きだす手法が回帰分析です。

回帰分析:記事数と月間PV数

Y = 18X + 52.6が導出さました。

つまり、100記事(X)の場合は、Y = 18 × 100 + 52.6= 1852 となり、100記事投稿した場合には月間PV数が1,852PVになることが過去のデータから予測されます。

準備したデータ

年月月間PV数記事数
2020年10月756
2020年11月35213
2020年12月49521
2021年1月59627
2021年2月81034
2021年3月47635
2021年4月52637
2021年5月75237
2021年6月92242
当ブログの月間PV数と記事数

スプレッドシートでの単回帰分析の実行方法

データを準備

散布図の作成

先ほどのデータを張り付けた範囲選択しながら【挿入】>【グラフ】をクリック。

グラフの種類を【散布図】を選択します。

「y = ax + b」の直線を求める

グラフエディタから【系列】を選択し、トレンドラインのチェックボックスをチェックします。

【種類】は、今回は【線形】を選択します。

【ラベル】は、【方程式を使用】を選択します。

完成したデータ

以下の線は、プロットされたデータに最も誤差の小さい線が描かれました。

単回帰分析結果を確認する

R二乗値を確認

今回で言えば、R二乗値は、0.744です。

0~1の間の数値をとる数値であり、どれぐらいプロットされたデータを「y = ax + b」の式で説明できているかを表します。

<R二乗値の判断目安>(R二乗値の明確な判断基準は定められておらず、大体の目安にはなります。)

  • 0.6以下:モデルが説明できていない
  • 0.7~0.9:モデルの説明ができていると判断でき、信頼しても良い。
  • 0.9以上:過学習していないか注意

今回は、0.744なので、プロットされたデータを説明できていると思います。

「y = ax + b」の式を確認

Y = 18X + 52.6が導出さました。

つまり、100記事(X)の場合は、Y = 18 × 100 + 52.6= 1852 となり、100記事投稿した場合には月間PV数が1,852PVになることが過去のデータから予測されます。

月間10,000PVに必要な記事数を計算する

スプレッドシートの「Goal Seek(ゴールシーク)機能」を使って計算してみました。

【アドオンを取得】>【Goal Seek】を検索し追加します。追加が完了すると以下の画像のように【Goal Seek】が現れます。

下準備

目標PVは、「記事数×18+52.6」で計算できるとわかっているので数式を組んでおきます。

Goal Seekの設定

「Set Cell」:ゴールとなるセルを選択、今回で言えば目標PV数10,000にしたい箇所です。

「To Value」:「Set Cell」で選択した数値にしたいゴールを記載します。今回は、10,000を入力します。

「By Changing Cell」:変化させる数値。今回は記事数を選択します。

【Solve】をクリックすると計算が開始されます。

結果は・・・

552記事。途方もない記事数です。笑

最後に

回帰分析を使えば今まで曖昧に「これぐらいかな?」と予測していたものが数式として導出されます。未来予測に説得力が増しビジネスでも使えます。

少しでも参考になれば幸いです。

関連記事>>>自宅マンションの市場価格を重回帰分析で予測、スプレッドシートで分析してみる。

関連記事>>>その分析結果は偶然ではありませんか?カイ二乗検定(独立性の検定)で確かめる|CHITEST関数

目次
閉じる