仮説検定

統計学の手法のひとつに,「仮説検定」というものがある.ごく簡単に言えば,次のような考え方である.

「50%の確率で当たる」と称するくじ引きがある.このくじを10回引くと,1度も当たらなかったとしよう.すると,「50%の確率で当たる」といっているのはウソじゃないか?という疑問をもつのは自然である.
そこで,「50%の確率で当たる」のが仮に正しいとしよう.「50%の確率で当たるくじが10回続けてはずれる確率」を計算すると,それは1/1024で非常に小さい.したがって,「50%の確率で当たる」というのはウソだと結論する.

仮説検定を講義で説明するたびに思い出すのは,小学生の時の話である.クラスに,ふだんあまり勉強のできない子がいた.ここでは彼の名を仮にX君とする.X君が,ある時テストで大変いい点数をとった.ところが,クラスの他の子たちが「あいつがそんなにいい点数がとれるはずがない.きっとカンニングしたに違いない」と言い出した.それが,あろうことか担任の先生までが「カンニングしたんだろう」と言い出したのだ.

統計学の講義の途中でこの話をしたら,「ひどい」と声をあげた学生がいた.その通りとんでもなくひどい話である.X君は,勉強は苦手だったが子供の割に人間のできた人で,とくに取り乱したりはしなかったように記憶しているが,私が彼の立場だったら泣き喚いて抗議したに違いない.

しかし,最初に例で示した仮説検定の推論は,このひどい話と同じではないだろうか?最初の例で「『50%の確率で当たる』というのはウソだ」と結論しているが,もしかしたら「50%の確率で当たる」というのは本当で,くじをひいた自分の運が悪いだけかもしれないのだ.

仮説検定の理論では,そういう誤った推論をしてしまう危険をきちんと数値で示すようになっている.だが,「『50%の確率で当たる』というのはウソだ」などと断罪してしまうような結論の前には,数値のほうにはなかなか注意がいかないことが多い.しかし,X君の話をひどいと思える心があるのならば,誤りの危険をきちんと数量的に考えるのを忘れてはならないと,強く思う.

(03. 6. 16)