実験に必要なサンプル数の考え方【n=3とは?】

n=3とTriplicate
この記事は約11分で読めます。

実験に必要なサンプル数の考え方【n=3とTriplicate1回の違い】

1サンプルを3ウェルに分けてやった実験結果を先生に見せたら,「ちゃんと “n = 3″ でやりましょう!」って言われたんですけど,”n = 3” ってどういう意味ですか?

本記事は,このような「なぜ?どうして?」にお答えします.

この記事を書いた人
フール

元研究者で獣医師/博士(Ph.D.)/派遣社員の研究員や臨床獣医師を経験/研究職への復帰を考えているバイオブランク/学歴が「身分の指標」ではなく「職務能力・専門能力の指標」として機能することを願う者/DeSci(分散型科学)の勉強中

フールをフォローする
フールの登場

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.

皆さんは,実験(統計解析)に必要なサンプル数の “n=3” をちゃんと説明できますか?

冒頭の女性のように,1つのサンプルを3つに分けて実施したり同じサンプルを3回測定すること(Triplicate1回)を “n = 3” と勘違いしている人は多いですね(笑).

かく言う私も,最初は理解していませんでした.

  • なぜ,1つのサンプルを3つに分けるのか?
  • どうして,同じサンプルを3回測定するのか?

この理由が分からずに “3” という数字だけに注目してしまうと,この落とし穴にハマってしまいますよ!

この記事では,実験の統計解析に必要なサンプル数の考え方についてまとめました.

本記事を読み終えると “n=3” を正しく理解でき,実験に必要なサンプル数の基準も分かるようになりますよ!

サマリー・「1サンプルを3分割して実施」または「同じサンプルを3回測定」は Triplicate1回です.

・ “n = 3” とは「独立したサンプルが3つ」という意味です.

・ “n = 3” は必要最低限のサンプル数というだけで,絶対ではありません.実験系によっては “n = 5” や “n = 10” も検討する必要があります.

・第一種過誤(αエラー):「真実では差がないのに,有意差があると判断してしまう」誤り

・第二種過誤(βエラー):「真実では差があるのに,有意差がないと判断してしまう」誤り

スポンサーリンク

“n=3” とは「独立したサンプルが3つ」

1サンプルを3つに分けて実施したり同じサンプルを3回測定することをTriplicate1回の実験と言います.

例えば,以下のような場合です.

  • qPCRで1サンプルを3ウェル用意する
  • レポーターアッセイで同じプレートを3回測定する

便宜的にこれらを “n=3” って表現する人も多く,それが余計な混乱を招くのだと思っているのですが,Triplicate1回の実験は “n=3” ではありません

フールの登場

なぜなら, “n=3” とは独立したサンプルが3つという意味だから.

3つの独立したデータポイントがあることが前提ですね.

これは,異なるサンプルや異なる実験動物(被験者)を使って得られたデータが3つという意味ですよ.

独立したサンプルとは?

独立したサンプルとは,サンプルの調整が独立している,つまり,サンプルの調整を別々(異なる日時)に行ったということです.

Triplicate1回の実験は,サンプルの調整が全部同じ日時ですね!

だから,Triplicate1回の実験は “n=3” ではなく “n=1” です.

Triplicate1回の実験も必要

フールの登場

注意してほしいのは,Triplicate1回の実験がダメって意味ではないこと!

貴重なサンプルの場合,どうしてもTriplicate1回の実験しかできないことはあるので,Triplicate1回は必要な考え方です.

ただ,その場合は “n=3” ではなく, “n=1” と書かなければなりません!

なぜ,1つのサンプルを3つに分けるのか?

なぜ,1つのサンプルを3つに分けるの?

どうして,同じサンプルを3回測定するの?

サンプル数が十分にあるのなら,Triplicateにする必要は無いと思いませんか?

実は,これには統計解析とは別の理由があります.

フールの登場

Triplicateにする理由は,単一の値の信頼性を確認したいから

qPCRやレポーターアッセイなど一部の実験系はバラつきがでやすく,慣れている人でも値がブレることがあります.

1サンプルにつき1ウェルしか置かない(1プレート1回の測定しかしない)と,その値がズレているのかどうかを検定できません.

Triplicateにすることで,同じサンプル間で値がブレていないってことを確認しているんです!

技術的な再現性の確認のために同一サンプルを3つに分けて測定しているだけなので,n数としてカウントされません.

Duplicateでも良い

単一の値の信頼性をテストするのが目的ですから,別にTriplicateにこだわる必要はありません.

フールの登場

2ウェルまたは2回測定のDuplicateでも良いのです!

Duplicateにすれば,試薬やサンプルの使用量を節約できますし,作業にかかる時間も短くなりますよ!

Triplicateよりは信頼性が低下

でも,Duplicate はサンプル内のバラつきを評価できないので,Triplicateよりは信頼性が低下します.

フールの登場

Triplicate か Duplicateか,この使い分けはサンプルや試薬の量・プレートデザイン・実験者の手技などを考慮して決めてください!

実験に必要なサンプル数

最後に実験に必要なサンプル数の考え方についてまとめます.

“n=3” は,統計解析をする上で必要な最低限の数です.

絶対に “n=3” にする必要はなく, “n=5” または “n=10” のように「n数」を増やしても良いのです.

フールの登場

ちなみに,投稿規定に “n=5” 以上を求める雑誌もありますよ!

実験に必要なサンプル数の考え方

それでは,実験に必要なサンプル数はどうやって決めるのでしょうか?

これから2つの独立したサンプルの平均値の差の検定(t検定)する場合のサンプル数を考えてみます!

予備実験

肥満マウスにおいて,体重(g)を指標にコントロールと試験薬の作用を観察しました.

結果は以下の通りです.

サンプル数 体重の平均値 バラつき(SD)
コントロール 10 47 13
試験薬 10 36 10

2群の平均値の差は 11 g です.

試験薬は肥満の解消に効果ありそうですね!

もちろん,この結果だけで「効果あり」って結論を出すのはダメですよ(笑).

実験に必要なサンプル数を考える

上記の結果に期待を抱いた担当研究員は,より詳細な検討を行うことにしました.

この2群間に差がある場合,統計学的な有意差は検出できるサンプル数はいくつかな?

そこで登場するのが,以下の数式*です!

n = 2 × (Zα/2 + Zβ)2 × SD2 ÷ Δ2
  • n:サンプル数
  • α:使用する検定の有意水準(5%または1%だが,通常は5%)
  • Zα/2:正規分布の上側α/2%点(5%の場合は,Z0.05/2 = Z0.025 = 1.9599 ≒ 1.96
  • β:有意差を見逃す確率(通常は20%)
  • Zβ:正規分布の上側β%点(20%の場合は,Z0.20 = 0.8416 ≒ 0.84
  • SD:予備実験で得られた標準偏差
  • Δ:予備実験で得られた平均値の差
フールの登場

この数式に各数値を代入してみましょう!

n = 2 × (1.96 + 0.84)2 × 112 ÷ 132 = 13.17556 ≒ 14

2群間に差がある場合,統計学的な有意差を検出するために必要なサンプル数は14(n=14)だと分かりましたね!

※使用したSDの値はどちらの群の値でも大丈夫ですが,より厳しめに設定するために大きい値を採用しました.ただ,ココには主観が入ります.本当は,2群の分散を併合した数値(併合分散)を使うのが良いですね!

*この数式は,2群間の平均値の差を検定するためのサンプルサイズ計算で,特にt検定において有用です.その他の統計解析(例:回帰分析やカイ二乗検定)には,異なるサンプルサイズ計算式が必要となります.

有意水準αと有意差を見逃す確率β

有意水準αと有意差を見逃す確率βについて簡単にまとめると以下の表にようになります!

真実
差がある 差がない
統計解析の結果 有意差あり 正しい(1-β) 誤り(α)
有意差なし 誤り(β) 正しい

本当は差がないのに,統計解析の結果で有意差ありと判定されてしまうことを第一種の過誤(α error)と呼びます.

逆に,本当は差があるのに,統計解析の結果で有意差なしと判定されてしまうことを第二種の過誤(β error)と呼びます.

対象とする学問(分野)にもよりますが,「差がない」物を「差がある」物と謳ってしまうと問題になることが多いので,第一種の過誤(α error)を重要視します.

無料で使えるツール

実験に必要なサンプル数の考え方をまとめてきましたが,ココで無料で使えるツールをご紹介します!

フールの登場

私は,Excelとかで計算してしまうのですが,それすらも面倒だと感じる人もいますからね(笑).

いろいろな無料ソフトがありますが,中でもG*Powerってソフトは有名だと思います.

興味がある方は,以下のサイトにアクセスしてみてください!

G*Power

もっと勉強したい方へ

  • CURTIS, Michael J., et al. Experimental design and analysis and their reporting: new guidance for publication in BJP. British journal of pharmacology, 2015, 172.14: 3461.

私は基礎研究で使う統計学しか知りませんが,もちろん,臨床研究で使う統計学もあります!

臨床研究に対する統計(医療統計)を学ぶのに,株式会社データシードが運営する「いちばんやさしい医療統計」がおすすめです.
代表の吉田さんは統計学の本も執筆していて,ご自身の挫折経験から「理論重視ではなく実践重視」をポリシーにされています.

 

最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.

2020年10月10日 フール

error: Content is protected !!
タイトルとURLをコピーしました