実験に必要なサンプル数の考え方【n=3とは?】

n=3とTriplicate
この記事は約8分で読めます。

実験に必要なサンプル数の考え方【n=3とは?】

 

1つのサンプルを3ウェルに分けてやった実験結果を先生に見せたら,「ちゃんと “n=3” でやりましょう!」って言われました…

“n=3” ってどういう意味ですか?

本記事は,このような「なぜ?どうして?」にお答えします.

 

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

皆さんは,実験(統計解析)に必要なサンプル数の “n=3” をちゃんと説明できますか?

実は,冒頭の女の子のように,1つのサンプルを3つに分けて実施したり同じサンプルを3回測定すること(Triplicate 1回)を “n = 3” と勘違いしている人は多いですね(笑).

かく言う私も,最初は理解していませんでした(笑).

  • なぜ,1つのサンプルを3つに分けるのか?
  • どうして,同じサンプルを3回測定するのか?

この理由が分からずに “3” という数字だけに注目してしまうと,この落とし穴にハマってしまいますよ(笑).

この記事では,実験の統計解析に必要なサンプル数の考え方についてまとめました.

本記事を読み終えると, “n=3” を正しく理解でき,実験に必要なサンプル数の基準も分かるようになりますよ!

 

サマリー・「1サンプルを3分割して実施」または「同じサンプルを3回測定」は,Triplicate 1回です.

・ “n=3” とは,「独立した実験を行った回数が3回」という意味です.

・ “n=3” は必要最低限のサンプル数というだけで,絶対ではありません.実験系によっては “n=5” や “n=10” も検討する必要があります.

“n=3” の意味は「独立した実験を行った回数が3回」

1サンプルを3つに分けて実施したり同じサンプルを3回測定することをTriplicate 1回の実験と言います.

例えば,以下のような場合です.

  • qPCRで1サンプルを3ウェル用意する
  • レポーターアッセイで同じプレートを3回測定する

便宜的にこれらを “n=3” って表現する人も多く,それが余計な混乱を招くのだと思っているのですが,Triplicate 1回の実験は “n=3” ではありません

なぜなら, “n=3” とは独立した実験を行った回数(試行回数)が3回という意味だからです.

独立した実験を行った回数

独立した実験を行った回数とは,サンプルの調整が独立している,つまり,サンプルの調整を別々(異なる日時)に行ったということです.

Triplicate 1回の実験は,サンプルの調整が全部同じ日時ですね!

だから,Triplicate 1回の実験は “n=3” ではなく “n=1”です.

Triplicate 1回の実験でも良いけど…

注意してほしいのは,Triplicate 1回の実験がダメって意味ではないことです!

貴重なサンプルの場合,どうしてもTriplicate 1回の実験しかできないことはあるので,Triplicate 1回は必要な考え方です.

ただ,その場合は “n=3” ではなく, “n=1” と書かなければなりません!

in vivo の場合は少し違う

“n=3” の意味は「独立した実験を行った回数が3回」と書きました.

でもこれはin vitro 実験系の場合で,in vivo(動物実験など)の場合は少し違います.

in vivo の場合は,群内の個体数が「n数」になるので,1群が3匹の場合を “n=3” と言います.

なぜ,1つのサンプルを3つに分けるのか?

なぜ,1つのサンプルを3つに分けるの?

 

どうして,同じサンプルを3回測定するの?

 

サンプル数が十分にあるのなら,Triplicateにする必要は無いと思いませんか?

実は,これには統計解析とは別の理由があります.

Triplicateにする理由は,単一の値の信頼性をテストしたいからです.

qPCRやレポーターアッセイなど一部の実験系は,バラつきがでやすく,慣れている人でも値がブレることがあります.

1サンプルにつき1ウェルしか置かない(1プレート1回の測定しかしない)と,その値がズレているのかどうかを検定できません.

Triplicateにすることで,同じサンプル間で値がブレていないってことを確認しているんです!

Duplicateでも良い

単一の値の信頼性をテストするのが目的ですから,別にTriplicateにこだわる必要はありません.

2ウェルまたは2回測定のDuplicateでも良いのです!

Duplicateにすれば,試薬やサンプルの使用量を節約できますし,作業にかかる時間も短くなりますよ!

一方,Triplicateよりは信頼性が低下します(サンプル内のバラつきを評価できないので).

TriplicateかDuplicateか,この使い分けは,サンプルや試薬の量・プレートデザイン・実験者の手技などを考慮して決めてください!

スポンサーリンク

実験に必要なサンプル数

最後に実験に必要なサンプル数の考え方についてまとめます.

“n=3” は,統計解析をする上で必要な最低限の数です.

絶対に “n=3” にする必要はなく, “n=5” または “n=10” のように「n数」を増やしても良いのです.

ちなみに,投稿規定に “n=5” 以上を求める雑誌もありますよ!

実験に必要なサンプル数の考え方

それでは,実験に必要なサンプル数はどうやって決めるのでしょうか?

これから2つの独立したサンプルの平均値の差の検定する場合のサンプル数を考えてみます!

予備実験

肥満マウスにおいて,体重(g)を指標にコントロールと試験薬の作用を観察しました.

結果は以下の通りです.

サンプル数体重の平均値バラつき(SD)
コントロール104713
試験薬103610

2群の平均値の差は,11 g です.

試験薬は肥満の解消に効果ありそうですね!

もちろん,この結果だけで「効果あり」って結論づけたらダメですよ(笑).

実験に必要なサンプル数を考える

上記の結果に期待を抱いた担当研究員は,より詳細な検討を行うことにしました.

 

この2群間に差がある場合,統計学的な有意差は検出できるサンプル数はいくつかな?

 

そこで登場するのが,以下の数式です!

n = 2 × (Zα/2 + Zβ)2 × SD2÷ Δ2
  • n:サンプル数
  • α:使用する検定の有意水準(5%または1%だが,通常は5%)
  • Zα/2:正規分布の上側α/2%点(5%の場合は,Z0.05/2= Z0.025 = 1.9599 ≒ 1.96
  • β:有意差を見逃す確率(通常は20%)
  • Zβ:正規分布の上側β%点(20%の場合は,Z0.20 = 0.8416 ≒ 0.84
  • SD:予備実験で得られた標準偏差
  • Δ:予備実験で得られた平均値の差

 

この数式に各数値を代入してみましょう!

n = 2 × (1.96 + 0.84)2× 112÷ 132= 13.17556 ≒ 14

2群間に差がある場合,統計学的な有意差を検出するために必要なサンプル数は14(n=14)だと分かりましたね!

※使用したSDの値はどちらの群の値でも大丈夫ですが,より厳しめに設定するために大きいい値を採用しました.ただ,ココには主観が入ります.本当は,2群の分散を併合した数値(併合分散)を使うのが良いですね!

有意水準αと有意差を見逃す確率β

有意水準αと有意差を見逃す確率βについて簡単にまとめると以下の表にようになります!

真実真実
差がある差がない
統計解析の結果有意差あり正しい(1-β)誤り(α)
統計解析の結果有意差なし誤り(β)正しい

本当は差がないのに,統計解析の結果で有意差ありと判定されてしまうことを第一種の過誤(α error)と呼びます.

逆に,本当は差があるのに,統計解析の結果で有意差なしと判定されてしまうことを第二種の過誤(β error)と呼びます.

対象とする学問(分野)にもよりますが,「差がない」物を「差がある」物と謳ってしまうと問題になることが多いので,第一種の過誤(α error)を重要視します.

無料で使えるツール

実験に必要なサンプル数の考え方をまとめてきましたが,ココで無料で使えるツールをご紹介します!

私は,Excelとかで計算してしまうのですが,それすらも面倒だと感じる人もいますからね(笑).

いろいろな無料ソフトがありますが,中でもG*Powerってソフトは有名だと思います.

興味がある方は,以下のサイトにアクセスしてみてください!

Universität Düsseldorf: G*Power

もっと勉強したい方へ

  • CURTIS, Michael J., et al. Experimental design and analysis and their reporting: new guidance for publication in BJP. British journal of pharmacology, 2015, 172.14: 3461.

スポンサーリンク


最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2020年10月10日 フール