回帰分析

統計学には随分と色々な手法があるなーと関心しきりの日々です。

色んなところに使える手法として、「回帰分析」というやつを紹介します。
これは、量的データxから、量的データyを予想する方法です。

これはテキストに載っていたデータです。
最高気温からアイスクリーム屋さんの客数を予想しようというものです。
ここでは最低気温は無視してください。

青い点が、観測されたデータです。
赤い線は、回帰分析によって求めた回帰直線です。
最高気温が上がると客数が増える傾向があることが分かります。

回帰直線は、Excelのグラフに線形近似式を追加すれば簡単に出てきます。

実際には、こんな式で計算できます。
iの付いている文字は個々のデータ、バー付きの文字は平均値です。

回帰分析が使える条件を確認します。
まず、説明変数が1つであること。
そして、説明変数と目的変数が量的データであることです。

説明変数とは、インプットにあたる変数です。
ここでは、最高気温のことです。

量的データとは、足し算や掛け算に意味のあるデータのことです。
男か女かとか成績の5段階評価とかは、足し算しても意味がなく質的データと言います。

この条件を満たしていれば回帰分析をすれば良いわけです。
次にこの条件を満たさない場合を考えます。
まずは、説明変数が2つの場合です。

最高気温だけでなく、最低気温も含めて考えるわけです。
こういう場合は、「重回帰分析」というやつを使います。
これは次の記事で。

コメント

タイトルとURLをコピーしました