仮説検定の謎【どうして「仮説を棄却」するのか?】
どうして,統計の検定では「仮説を棄却」する方法を使うの?ちょっとまわりくどいよね…「仮説を採用」する方法はダメなのかな?
本記事は,このような「なぜ?どうして?」にお答えします.
こんにちは.
博士号を取得後,派遣社員として基礎研究に従事しているフールです.
仮説検定では,帰無仮説と対立仮説を立てます.
そして,「帰無仮説を否定(棄却)して対立仮説を採用する」という方法を採用します.
最初から「対立仮説を支持する」やり方は無いの?
皆さんの中にも,このように考えたことがある人はいるでしょう.
私も最初はそう思ってました.
「A=Bである」という仮説を証明するのなら,「A=Bである」という仮説を支持する証拠を集めれば良いじゃん!
って思ってました.
でも実際は違います.
「A=Bである」という仮説を証明するなら,先ず「A=Bではない」という仮説を立てます.
そして,その仮説を棄却して「A=Bではないはずがありません」と主張するんです.
どうして,こんなまわりくどいやり方をするんでしょうか?
この記事では,仮説検定で「仮説を棄却」する理由をまとめました.
本記事を読み終えると,まわりくどい方法で検定をする理由が分かるようになりますよ!
サマリー・対立仮説を支持する方法は,対立仮説における矛盾が見つかると怖いのでやりません.
仮説検定の総論
そもそも仮説検定とは何なのか?
先ずはそれをまとめます.
例えば,海外の企業が開発したワクチンAと日本の企業が開発したワクチンBを考えます.
ワクチンBがワクチンAよりも優れている(効果がある)ことを示すにはどうすれば良いでしょうか?
方法は2つあります.
- 全人類(母集団)にワクチンを接種し,そのデータを集めて比較する
- 母集団を代表するような標本集団を作って,標本集団にワクチンを接種してデータを比較する
aのやり方は不可能ですよね(笑).
仕方がないのでbのやり方を採用します.
ただ,bの方法では1つ課題があります.
それは,「標本集団の結果は母集団にも当てはまるのか?」という疑問です.
だから,標本集団の結果を使って母集団における仮説を検証するんです.
今回の場合は,「ワクチンBがワクチンAよりも効果がある」という仮説を調べるんです.
これが仮説検定です.
仮説検定のやり方
続いて,仮説検定のやり方を簡単にまとめます.
仮説検定には4つのステップがあります.
- 仮説を立てる.
- データを集める.
- p値を求める.
- p値を用いて仮説を棄却するか判断する.
仮説を立てる
2つの仮説を立てます.
- 対立仮説
- 帰無仮説
対立仮説は,研究者が証明したい仮説です.
両ワクチンの効果を何で測るのかによって仮説は変わりますが,例えば,中和抗体価で考えてみましょう.
「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」が対立仮説です.
帰無仮説は棄却するための仮説です.
今回なら「ワクチンBとワクチンAの間に,中和抗体の誘導効果の差は無い」が帰無仮説です.
データを集める
実際にデータを集めるための実験を行います.
ココでのポイントは,帰無仮説が正しいという前提で実験を行うということです.
そして,「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という結果が得られたとします.
結論候補としては,2パターンありますね!
- 帰無仮説が正しいという前提が間違っている.
- 帰無仮説は正しいんだけど,偶然,そのような結果になっちゃった.
p値を求める
どちらの結論にするのかを決めるために,p値を求めます.
p値は,帰無仮説が正しいという前提において「帰無仮説と異なる結果が出る確率」を意味します.
今回なら「ワクチンBとワクチンAの間に,中和抗体の誘導効果の違いは無い」という前提で「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という結果が得られる確率を計算します.
仮説を棄却する
求めたp値を基準値と比較します.
基準値とは,有意水準とか危険率とも呼ばれるものです.
多くの検証では,0.05(5%)または 0.01(1%)を採用しています.
求めたp値が基準値よりも小さかったら,結論αになります.
つまり,「ワクチンBとワクチンAの間に,中和抗体の誘導効果の差は無い」という前提が間違っているとなります.
これを「帰無仮説を棄却する」と言います.
この時点で「ワクチンBとワクチンAの間に,中和抗体の誘導効果の差は無いわけがありません」と主張できます.
これをもって対立仮説(ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある)の採用ができるのです.
ちなみに,反対にp値が基準値よりも大きかったら,結論βになります.
どうして「帰無仮説を棄却」するのか?
さて本題です.
「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という仮説を証明するために,先ず「ワクチンBとワクチンAの間に,中和抗体の誘導効果の差は無い」という仮説を立てました.
そして,その仮説を棄却して「ワクチンBは,ワクチンAよりも中和抗体の誘導効果が強くないはずはありません」と主張しました.
なぜ,こんなまわりくどいやり方をするんでしょうか?
対立仮説を指示するパターンを考えてみる
それでは対立仮説(ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある)を支持するパターンを考えてみましょう!
- 先ず標本集団Ⅰで検証し「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という結果を得ました.
- 次に標本集団Ⅱで検証し「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という結果を得ました.
- さらに標本集団Ⅲ,Ⅳでも検証し「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」という結果を得ました.
対立仮説を支持する証拠が集まりました.
これらの証拠から「ワクチンBは,ワクチンAよりも中和抗体の誘導効果がある」と言えるでしょうか?
言えるかもだけど,もしかしたら次に検証する集団では違うかもしれないよね?
その通りです!
でも「もしかしたら次は…」「もしかしたら次は…」ってことを繰り返しているとキリがありませんよね(笑).
ところで,もし標本集団 N で検証し「ワクチンBは,ワクチンAよりも中和抗体の誘導効果に差が無い」という結果を得たらどうなるでしょうか?
対立仮説を支持する証拠はいくらあっても十分とは言えません.
しかし,対立仮説を棄却する証拠は1つで十分なんです.
だから,対立仮説を指示する方法は行いません.
考え方は背理法と似ている
高校の数学で背理法を勉強しました.
背理法を簡単にまとめると以下のようになります.
命題A(○○である)を証明したい ↓ 命題Aを否定する仮定B(○○ではない)を立てる ↓ 仮定Bを立てたことで起こる矛盾を1つ探す ↓ 命題Aの否定(仮定B)は間違いだと言える ↓ 命題Aは正しいと言える
仮説検定は背理法に似ていますね!
- 対立仮説を支持する方法は,きっと「矛盾」が見つかるので(対立仮説における矛盾が見つかると怖いので)実施できません.
- 帰無仮説を棄却する方法は,1つでも「矛盾」を見つければ良いので分かりやすいです.
以上,仮説検定で「仮説を棄却」する理由でした.
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2020年12月28日 フール