多変量解析は複雑な計算を必要とするので、高価なソフトが必要だったりします。
でも単回帰分析ならExcelでも簡単に実行可能。
それどころか、既に使ったことがあるかもしれません。
実例と共に紹介します。
これは、2008年の天皇賞とジャパンカップの両方に出走した馬のリストです。
「前走タイム」というのは、天皇賞のタイム。
「走破タイム」というのは、ジャパンカップのタイムです。
果たして、天皇賞のタイムからジャパンカップのタイムは予測できるのか?
Excelでちょいちょいっとグラフを描けば、単回帰分析ができます。
目的変数と説明変数のサンプルをいくつか用意します。
そして、それらの散布図を描きます。
「近似曲線の追加」によって、近似曲線を追加します。
近似曲線の設定は適当に。
この近似曲線は実は、「単回帰分析」の理論を用いて描かれています。
単回帰分析なら、Excelで簡単に計算できるというわけです。
グラフを詳しく見てみます。
これを見ると、「前走タイム」と「走破タイム」には右上がりの関係、つまり「正の相関」があります。
つまり、前走タイムから走破タイムが予測できるということです。
グラフ中に、「y=0.7113x+0.0007」とあります。
これは、「(走破タイム)=0.7113×(前走タイム)+0.0007」という意味です。
タイムをコンピュータ内部で小数で扱ってる関係で数値が変ですが、それは気にしなくて良い。
とにかく、「前走タイム」から「走破タイム」が数値的に計算できるということが大事。
もうひとつ、大事なこと。
「R2=0.8282」と書かれていますが、これは「決定係数」と言って、回帰分析の正確さを表します。
この値が1なら、「完璧に予測できる」ということです。
0.8282はかなり良い値なので、この予測式は信用できそうです。
実際には、サンプルが少ないから、あまりアテにならないのだけど。
コメント