- 重回帰分析で何ができるか知りたい方
- スプレッドシートでの実行方法を知りたい方
- 過去のデータから未来予測を出したい方
本記事では、過去の不動産取引データから我が家の市場価格を予測してみようと思います。
重回帰分析とは?
重回帰分析とは、回帰分析のひとつであり「単回帰分析」の発展系です。
「単回帰分析」についてはこちらの記事で書いています。
「単回帰分析」とは、蓄積されたデータをもとに、変数の関係を y = ax + b の式に落とし込む統計手法です。
そして、単回帰分析との違いは、複数の要因になる数値(説明変数)で分析できることです。
今回の例題の不動産価格は、「駅からの距離」「専有面積」「築年数」などの複数の要因で価格が決定されると想定されます。その為、今回は「重回帰分析」で我が家のマンション価格をモデル化してみようと思います。
事前準備
こちらのサイトからデータを抽出しました。
データクレンジングを行い、以下の様なデータを作成しました。サンプル数は70件です。

スプレッドシートでの重回帰分析の実行方法
スプレッドシートの下準備


XLMiner Analysis ToolPakを使って重回帰分析をはじめる
データの準備が完了し、アドオン「 XLMiner Analysis ToolPak 」の準備ができれば重回帰分析をはじめていきます。

起動後は、以下の画像が現れます。【Linear Regression】を選択します。

パラメーターを設定していきます。

- Input Y Range : 目的変数を入力します。「取引価格」を選択します。
- Input X Range : 説明変数を入力します。「面積」「築年数」「距離(分)」を選択します。
- Labels : 1行目がラベルがある為、チェックを入れます。
- Output Range : 重回帰分析の出力先を指定します。
以下画像のように設定しています。

【SUMMARY OUTPUT】が出力されれば一旦完了です。

重回帰分析の出力結果を確認していきます。
【Adjusted R Square(補正R二乗値)】重回帰分析がどれぐらい当てはまっているのかを表します。一般的に0.8程度あれば信頼して良いかと思います。

【P-value(P値)】各説明変数をどれぐらい信頼して良いのかを表します。一般的に0.05以下であれば信頼して良いとされています。「距離(分)」のP値が0.2となっており0.05を上回っています。取引価格に影響を与えていない事がわかります。

【Intercept(切片)】【Coefficients(係数)】です。
取引価格を予測してみる
専有面積75㎡・築年数1年・距離8分で計算してみます。計算式は以下の通りです。
Y(物件価格) = a × 面積 + b × 築年数 + c × 距離 + d
諸条件を代入してみます。
Y = (540224×75㎡)+(-635432×1年)+ (-393424×8分)+ 14736505
結果は・・・
Y = 51,470,489
今回の検証では、購入価格よりも高い結果となりました!
最後に
今回の検証は、データ数が少ない事や面積の小さい部屋も入っていたり、周辺駅が隣接しており駅距離が機能していないなどの改善が必要な箇所が多いです。とはいえ、ざっくりとした市場感把握には使えると思いますので是非試してみてください!
また、回帰分析を使えば今まで曖昧に「これぐらいかな?」と予測していたものが数式として導出されます。未来予測に説得力が増しビジネスでも使えます。
少しでも参考になれば幸いです。