母集団

「母集団」なのか「標本」なのかって、あまり意識してないですよね?

母集団とは、想定している全てです。
標本は、その中からいくつかを取り出したものです。

たとえば、ニュースで内閣支持率なんてのが出たりします。
上がったとか下がったとかニュースで言っていますよね。
違うな、上がったってのは聞かないですね。

とにかく、あれを見てこう思った人はいませんか?
「おいらは支持するかどうかなんて聞かれていないのに、勝手に決めないでくれ!」
・・・と。

思わねーか。

内閣支持率に対する母集団は、日本の有権者全員。
標本は、その中からたまたま「支持しますか?」と聞かれた人です。

内閣支持率は、「有権者全員に聞いたら、こんな割合でした」みたいな雰囲気で発表されます。
つまり、「母集団の値」のように発表されます。
でも、実際には、ごく一部の人にしか質問していません。
実際に発表されているのは、「標本の値」です。

これがいわゆる標本詐欺です。
そんな言葉ないけど。
当然ですが、標本の統計量は、母集団の統計量とは一致しません。

ここから、統計学の言葉にします。

標本の平均を標本平均、母集団の平均を母平均と言います。
標本平均を母平均として扱うのには問題があります。
でも、実際にはそれをやっています。

これは「標本平均の平均」が母平均に一致するためです。
平均の平均なんて意味不明なので式にします。

μは、母平均です。
Eというのは、平均という意味です。
期待値とも言います。

バー付きのXは、標本平均です。
定義を書くまでもないかもしれないけれど。

平均の平均とか意味不明ですが、この式が成立するから、発表される内閣支持率は「それほど間違ってない」と言えるのです。
ただし重ねて、母集団の値とは一致していないことを強調しておきます。

高校の数学で「平均」だけでなく「分散」も習いました。
平均の場合と違って、「標本分散の平均」は「母分散」に一致しないから注意が必要です。

About katty0324

One comment

Leave a Reply

Scroll To Top