2群間比較の繰り返しはダメ【3群以上の群間比較】

この記事は約8分で読めます。

A-C群の統計解析で,A vs.B, B vs. C, C vs. Aをやったら怒られた…どうして?

本記事は,このような「なぜ?どうして?」にお答えします.

 

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

3群以上の統計解析で,t検定マン・ホイットニーのU検定の繰り返しで群間比較をやっている人はいますか?

実はそれ,間違った方法なんです.

なぜなら,本当は差が無いのに有意差があると判定してしまう確率が高くなるからです.

この記事では,3群以上の統計解析で2群間の比較の繰り返しがダメな理由をまとめました.

本記事を読み終えると,t検定マン・ホイットニーのU検定の繰り返しがダメなことだと分かりますよ!

サマリー・3群以上ある場合,群間比較をしたい時は多重比較をしなければなりません.

2群間の比較の繰り返しを行う者がいる理由

A群,B群,C群の3群における統計解析で,A vs.B,B vs. C,C vs. A と2群間の比較を繰り返す人は多いです.

原因は,研究室や部署で行われている統計解析を,指導教官や上司に言われるがまま実施するという悪しき伝統があるからでしょう.

私が博士課程の学生だったころも,指導教員や先輩は皆,2群間の比較を繰り返しを「善し」としていました*

残念ながら,私以外の学生は,指導教官や先輩に言われるがまま実施する「生徒」でした.

幸か不幸か,私は空気が読めない人です(笑).

指導教官や先輩に「それを違います!」と抵抗し続けた日々が,今では懐かしい.

*この背景には,以下の理由が考えられると思います.

・多重比較では有意差がでにくい
・全ての実験デザインを2群比較に変えると予算・時間・労働力の全てが足りない

前者は,2群間の比較を繰り返しがダメだと知っている者の発想ですので質が悪いです.

後者は,実験計画を立てる段階で統計検定のことを考慮しなかったことが原因です(悪しき伝統のせいで,統計検定のことを考慮した実験計画法を指導できる人自体が少ないのですが…).

スポンサーリンク

2群間の比較の繰り返しはダメな理由

なぜ,2群間の比較の繰り返しはダメなのでしょうか?

その理由は,有意水準の考え方にあります.

よく使われる「有意水準」または「危険率」には,以下のような意味があります.

同じ実験を繰り返したとき,有意差が無いのに有意差があると判定される確率

つまり,α = 0.05とは,「同じ実験を20回繰り返したとき,1回は有意差が無いのに有意差があると判定される」ことを意味します.

これを2群の群間比較と3群の群間比較で考えてみましょう!

2群間の比較の場合

1回 2回 3回 4回 5回 6回 7回 8回 9回 10回 11回 12回 13回 14回 15回 16回 17回 18回 19回 20回
A群 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20
B群 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 B15 B16 B17 B18 B19 B20
有意差 有り

各群における各回の平均値をA1-A20またはB1-B20とします.

理論上は,「有意差が無いのに有意差があると判定される」のは1回です.

今回は,それが12回目でした.

3群間の比較の場合

1回 2回 3回 4回 5回 6回 7回 8回 9回 10回 11回 12回 13回 14回 15回 16回 17回 18回 19回 20回
A群 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20
B群 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 B15 B16 B17 B18 B19 B20
C群 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
有意差 有り 有り 有り

各群における各回の平均値をA1-A20,B1-B20またはC1-C20とします.

そして,

  • A vs. B
  • B vs. C
  • C vs. A

と2群間の比較を繰り返すとします.

理論上は,「有意差が無いのに有意差があると判定される」1回は,3回も出現することになります.

今回は,それが2回目・8回目・18回目でした.

この場合の有意水準は,1 -(1 – 0.05)×(1 – 0.05)×(1 – 0.05)≒ 0.14です.

つまり,「同じ実験を7回繰り返したとき,1回は有意差が無いのに有意差があると判定される」のと同じです.

もうお分かりですね!

2群間の比較を繰り返すと,有意水準が上昇し,「有意差が無いのに有意差があると判定される」確率が上がってしまうのです

この傾向は,比較する群数が増えれば増えるとほど顕著になりますよ~

p値とは?

p値には,以下のような意味があります.

観察された群間の差が偶然生じる可能性の尺度

つまり,p = 0.05とは,「観察された群間の差が偶然生じる可能性は,20回に1回である」ことを意味します.

だから,α = 0.05のときのp < 0.05とは,「観察された群間の差が偶然生じる可能性は20回に1回未満であり,これが偶然生じた可能性は低い」ことを意味します.

もっと勉強したい方へ

以下の書籍はオススメです!

・標準偏差(SD)と標準誤差(SE)の使い分けから,検定法の理解に必要な基本知識までを学べます.

・2群の比較,3群以上の比較,分散分析の基礎を学べます.

以上,2群間比較の繰り返しはダメな理由でした.

最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2020年4月21日 フール

error: Content is protected !!
タイトルとURLをコピーしました