A-C群の統計解析で,A vs.B, B vs. C, C vs. Aをやったら怒られた…どうして?
本記事は,このような「なぜ?どうして?」にお答えします.
こんにちは.
博士号を取得後,派遣社員として基礎研究に従事しているフールです.
3群以上の統計解析で,t検定やマン・ホイットニーのU検定の繰り返しで群間比較をやっている人はいますか?
実はそれ,間違った方法なんです.
なぜなら,本当は差が無いのに有意差があると判定してしまう確率が高くなるからです.
この記事では,3群以上の統計解析で2群間の比較の繰り返しがダメな理由をまとめました.
本記事を読み終えると,t検定やマン・ホイットニーのU検定の繰り返しがダメなことだと分かりますよ!
2群間の比較の繰り返しを行う者がいる理由
A群,B群,C群の3群における統計解析で,A vs.B,B vs. C,C vs. A と2群間の比較を繰り返す人は多いです.
原因は,研究室や部署で行われている統計解析を,指導教官や上司に言われるがまま実施するという悪しき伝統があるからでしょう.
私が博士課程の学生だったころも,指導教員や先輩は皆,2群間の比較を繰り返しを「善し」としていました*.
残念ながら,私以外の学生は,指導教官や先輩に言われるがまま実施する「生徒」でした.
幸か不幸か,私は空気が読めない人です(笑).
指導教官や先輩に「それを違います!」と抵抗し続けた日々が,今では懐かしい.
*この背景には,以下の理由が考えられると思います.
・多重比較では有意差がでにくい ・全ての実験デザインを2群比較に変えると予算・時間・労働力の全てが足りない
前者は,2群間の比較を繰り返しがダメだと知っている者の発想ですので質が悪いです.
後者は,実験計画を立てる段階で統計検定のことを考慮しなかったことが原因です(悪しき伝統のせいで,統計検定のことを考慮した実験計画法を指導できる人自体が少ないのですが…).
2群間の比較の繰り返しはダメな理由
なぜ,2群間の比較の繰り返しはダメなのでしょうか?
その理由は,有意水準の考え方にあります.
よく使われる「有意水準」または「危険率」には,以下のような意味があります.
同じ実験を繰り返したとき,有意差が無いのに有意差があると判定される確率
つまり,α = 0.05とは,「同じ実験を20回繰り返したとき,1回は有意差が無いのに有意差があると判定される」ことを意味します.
これを2群の群間比較と3群の群間比較で考えてみましょう!
2群間の比較の場合
1回 | 2回 | 3回 | 4回 | 5回 | 6回 | 7回 | 8回 | 9回 | 10回 | 11回 | 12回 | 13回 | 14回 | 15回 | 16回 | 17回 | 18回 | 19回 | 20回 | |
A群 | A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | A9 | A10 | A11 | A12 | A13 | A14 | A15 | A16 | A17 | A18 | A19 | A20 |
B群 | B1 | B2 | B3 | B4 | B5 | B6 | B7 | B8 | B9 | B10 | B11 | B12 | B13 | B14 | B15 | B16 | B17 | B18 | B19 | B20 |
有意差 | 有り |
各群における各回の平均値をA1-A20またはB1-B20とします.
理論上は,「有意差が無いのに有意差があると判定される」のは1回です.
今回は,それが12回目でした.
3群間の比較の場合
1回 | 2回 | 3回 | 4回 | 5回 | 6回 | 7回 | 8回 | 9回 | 10回 | 11回 | 12回 | 13回 | 14回 | 15回 | 16回 | 17回 | 18回 | 19回 | 20回 | |
A群 | A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | A9 | A10 | A11 | A12 | A13 | A14 | A15 | A16 | A17 | A18 | A19 | A20 |
B群 | B1 | B2 | B3 | B4 | B5 | B6 | B7 | B8 | B9 | B10 | B11 | B12 | B13 | B14 | B15 | B16 | B17 | B18 | B19 | B20 |
C群 | C1 | C2 | C3 | C4 | C5 | C6 | C7 | C8 | C9 | C10 | C11 | C12 | C13 | C14 | C15 | C16 | C17 | C18 | C19 | C20 |
有意差 | 有り | 有り | 有り |
各群における各回の平均値をA1-A20,B1-B20またはC1-C20とします.
そして,
- A vs. B
- B vs. C
- C vs. A
と2群間の比較を繰り返すとします.
理論上は,「有意差が無いのに有意差があると判定される」1回は,3回も出現することになります.
今回は,それが2回目・8回目・18回目でした.
この場合の有意水準は,1 -(1 – 0.05)×(1 – 0.05)×(1 – 0.05)≒ 0.14です.
つまり,「同じ実験を7回繰り返したとき,1回は有意差が無いのに有意差があると判定される」のと同じです.
もうお分かりですね!
2群間の比較を繰り返すと,有意水準が上昇し,「有意差が無いのに有意差があると判定される」確率が上がってしまうのです.
この傾向は,比較する群数が増えれば増えるとほど顕著になりますよ~
p値とは?
p値には,以下のような意味があります.
観察された群間の差が偶然生じる可能性の尺度
つまり,p = 0.05とは,「観察された群間の差が偶然生じる可能性は,20回に1回である」ことを意味します.
だから,α = 0.05のときのp < 0.05とは,「観察された群間の差が偶然生じる可能性は20回に1回未満であり,これが偶然生じた可能性は低い」ことを意味します.
もっと勉強したい方へ
以下の書籍はオススメです!
・標準偏差(SD)と標準誤差(SE)の使い分けから,検定法の理解に必要な基本知識までを学べます.
・2群の比較,3群以上の比較,分散分析の基礎を学べます.
以上,2群間比較の繰り返しはダメな理由でした.
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2020年4月21日 フール