- 単回帰分析で何ができるか知りたい方
- スプレッドシートでの実行方法を知りたい方
- 過去のデータから未来予測を出したい方
本記事では、当ブログの2020年10月~2021年6月の月間PV数と記事数から単回帰分析を使って月間10,000PVに必要な記事数を予測していこうと思います。
単回帰分析とは?
「単回帰分析」とは、蓄積されたデータをもとに、変数の関係を y = ax + b の式に落とし込む統計手法です。
具体的には、以下の例を見ていただくのがわかりやすいです。
記事数と月間PV数の関係性を表す散布図です。記事数が増える毎にPV数が増える関係性が見てとれます。

このプロットされた実測値と最も誤差が少ない線を導きだす手法が回帰分析です。

Y = 18X + 52.6が導出さました。
つまり、100記事(X)の場合は、Y = 18 × 100 + 52.6= 1852 となり、100記事投稿した場合には月間PV数が1,852PVになることが過去のデータから予測されます。
準備したデータ
年月 | 月間PV数 | 記事数 |
---|---|---|
2020年10月 | 75 | 6 |
2020年11月 | 352 | 13 |
2020年12月 | 495 | 21 |
2021年1月 | 596 | 27 |
2021年2月 | 810 | 34 |
2021年3月 | 476 | 35 |
2021年4月 | 526 | 37 |
2021年5月 | 752 | 37 |
2021年6月 | 922 | 42 |
スプレッドシートでの単回帰分析の実行方法
データを準備

散布図の作成
先ほどのデータを張り付けた範囲選択しながら【挿入】>【グラフ】をクリック。

グラフの種類を【散布図】を選択します。

「y = ax + b」の直線を求める
グラフエディタから【系列】を選択し、トレンドラインのチェックボックスをチェックします。

【種類】は、今回は【線形】を選択します。

【ラベル】は、【方程式を使用】を選択します。

完成したデータ
以下の線は、プロットされたデータに最も誤差の小さい線が描かれました。

単回帰分析結果を確認する
R二乗値を確認
今回で言えば、R二乗値は、0.744です。
0~1の間の数値をとる数値であり、どれぐらいプロットされたデータを「y = ax + b」の式で説明できているかを表します。
<R二乗値の判断目安>(R二乗値の明確な判断基準は定められておらず、大体の目安にはなります。)
- 0.6以下:モデルが説明できていない
- 0.7~0.9:モデルの説明ができていると判断でき、信頼しても良い。
- 0.9以上:過学習していないか注意
今回は、0.744なので、プロットされたデータを説明できていると思います。
「y = ax + b」の式を確認
Y = 18X + 52.6が導出さました。
つまり、100記事(X)の場合は、Y = 18 × 100 + 52.6= 1852 となり、100記事投稿した場合には月間PV数が1,852PVになることが過去のデータから予測されます。
月間10,000PVに必要な記事数を計算する
スプレッドシートの「Goal Seek(ゴールシーク)機能」を使って計算してみました。
【アドオンを取得】>【Goal Seek】を検索し追加します。追加が完了すると以下の画像のように【Goal Seek】が現れます。

下準備
目標PVは、「記事数×18+52.6」で計算できるとわかっているので数式を組んでおきます。

Goal Seekの設定
「Set Cell」:ゴールとなるセルを選択、今回で言えば目標PV数10,000にしたい箇所です。
「To Value」:「Set Cell」で選択した数値にしたいゴールを記載します。今回は、10,000を入力します。
「By Changing Cell」:変化させる数値。今回は記事数を選択します。

【Solve】をクリックすると計算が開始されます。
結果は・・・
552記事。途方もない記事数です。笑
まとめ
回帰分析を使えば今まで曖昧に「これぐらいかな?」と予測していたものが数式として導出されます。未来予測に説得力が増しビジネスでも使えます。
少しでも参考になれば幸いです。