Excelで回帰分析

多変量解析は複雑な計算を必要とするので、高価なソフトが必要だったりします。

でも単回帰分析ならExcelでも簡単に実行可能。
それどころか、既に使ったことがあるかもしれません。

実例と共に紹介します。
これは、2008年の天皇賞とジャパンカップの両方に出走した馬のリストです。

「前走タイム」というのは、天皇賞のタイム。
「走破タイム」というのは、ジャパンカップのタイムです。

果たして、天皇賞のタイムからジャパンカップのタイムは予測できるのか?

Excelでちょいちょいっとグラフを描けば、単回帰分析ができます。

目的変数と説明変数のサンプルをいくつか用意します。
そして、それらの散布図を描きます。

「近似曲線の追加」によって、近似曲線を追加します。

近似曲線の設定は適当に。

この近似曲線は実は、「単回帰分析」の理論を用いて描かれています。
単回帰分析なら、Excelで簡単に計算できるというわけです。

グラフを詳しく見てみます。

これを見ると、「前走タイム」と「走破タイム」には右上がりの関係、つまり「正の相関」があります。
つまり、前走タイムから走破タイムが予測できるということです。

グラフ中に、「y=0.7113x+0.0007」とあります。
これは、「(走破タイム)=0.7113×(前走タイム)+0.0007」という意味です。

タイムをコンピュータ内部で小数で扱ってる関係で数値が変ですが、それは気にしなくて良い。
とにかく、「前走タイム」から「走破タイム」が数値的に計算できるということが大事。

もうひとつ、大事なこと。
「R2=0.8282」と書かれていますが、これは「決定係数」と言って、回帰分析の正確さを表します。
この値が1なら、「完璧に予測できる」ということです。

0.8282はかなり良い値なので、この予測式は信用できそうです。
実際には、サンプルが少ないから、あまりアテにならないのだけど。

コメント

タイトルとURLをコピーしました