回帰直線を求める(2)

xとyの平均の点を通る直線。

この傾きを統計学的に求めれば、それが回帰直線です。
では、いかに傾きを決定するか?
その数学的理由は後で述べるとして、結論から。

この傾きは、共分散と分散の比で決まります。

こんな具合。
分散は高校でも習った言葉だけど、共分散って何だ?

これが分散と共分散の定義。
こうやって見ると、xとxの共分散が、xの分散とも言えるような定義ですね。

分散はサンプルの広がり具合。

共分散は、xとyの相関の強さにも関係する指標です。
また別の指標ですが、「相関係数」というものは、共分散を分散で規格化したものです。
逆に言えば、共分散も相関係数に近い性質があるということです。

言葉で表現すると。
共分散は、「偏差積」、つまり「xの偏差とyの偏差の積」の平均。
分散は、「xの偏差の2乗」の平均。

そういうわけで、単回帰分析によって得られる回帰直線は以下。

グラフも描いておきます。

プロットの真ん中を通っている感じはしますね。

次は、解析的に回帰直線を求めてみます。

コメント

  1. […] 回帰直線を求める(2) 回帰直線を求める(3) […]

タイトルとURLをコピーしました