誤差を知り、誤差を許容して、最適な判断をする。

僕がはじめて統計学に取り組んだのは、4年前、大学3年生の時でした。その時のブログを見返しても分かるんですが、統計学を勉強しはじめた目的は競馬予想でした。
大学生の時は、自分の専門と全然関係なくても興味ある分野の本はたくさん読みましたが、中でも衝撃的で、強力な武器となってくれたのが統計学です。

統計学が最強の学問である


統計学が最強の学問である
そんな気持ちをよく理解してくれてるようなタイトルの本。

信頼区間の衝撃

統計学的としてはめちゃくちゃ基本的なことなんですが、「信頼区間」という概念があります。
全国民の統計を取らなくても、ランダムサンプリングして一部の人の統計をとるだけで、全国民の統計をとったのと「およそ等しい結果」が得られます。ここまでは良く知られていると思うんですが、統計学は「およそ等しい結果」というのがどの程度正しいかまで明らかにします。
信頼区間は「真の値は、95%の確率でこの範囲におさまります」という範囲なんですが、あくまで部分集合の統計なので「100%おさまる区間」ではないんです。
統計学は100%を求めようとしません。なんて謙虚な!

誤差を知り、誤差を許容して、最適な判断をする。

あきらめるという選択肢を用意して、何が本当に大事か考える。」に書いた内容にも関連するんですが、100%完璧を達成させる労力というのは実はものすごく大きい場合があります。最後の1%を埋めるのが実はものすごくコストが大きくて、その割に効果が薄いということがあります。
統計学は、その最後の1%の誤差がどれほどの影響を与えるかを理論的に明らかにしてくれます。だから、コストと比較して、最適な選択をすることができます。
この本には「統計学は最善最速の正解を出す」と書かれています。正解を出す方法はあっても、莫大なコストがかかったり時間がかかったりするかもしれません。統計学は誤差を許容することで、迅速に「最適な答え」を導いてくれます。100%の正解を出すのには向きませんが、99%の正解を非常に低いコストで求めることができます。

コメント

タイトルとURLをコピーしました