データが名義変数の場合の解析【実験データの具体的な解析方法】

Excelで二項分布の解析
この記事は約9分で読めます。

化合物Aを投与したマウスの生死を判定したんだけど,統計解析をどうすれば良いのかな?

本記事は,このような「なぜ?どうして?」にお答えします.

この記事を書いた人
フール

元研究者で獣医師/博士(Ph.D.)/派遣社員の研究員や臨床獣医師を経験/研究職への復帰を考えているバイオブランク/学歴が「身分の指標」ではなく「職務能力・専門能力の指標」として機能することを願う者/DeSci(分散型科学)の勉強中

フールをフォローする

本記事の内容・Excelで二項分布の確率を算出する方法

フールの登場

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.

理論や定義よりも実際にどういう操作をするのかを知りたい!

そんな方に向けて,実験データの具体的な解析方法の記事を書いています.

これから数回に分けて,データが名義変数の場合についてまとめます.

例えば,抗体が陽性 or 陰性とか,生存 or 死亡とか,特定の症状の有無とかですね.

今回は,大学にいたころに私が経験したマウスの生死判定*を例に,化合物Aを投与した群と対照群の生存数の比較を行います.

*諸事情により実際のデータは使えないので(笑),私が架空の内容を設定しました.

本記事を読み終えると,データが名義変数の場合でも堂々と統計解析ができるようになりますよ!

サマリー・データが名義変数で,データの種類が1つの場合は,二項分布またはポアソン分布を使いましょう!

薬剤の投与がマウスの生存に与える影響

まだ私が学部生だったころ,ある感染症の発症を抑える化合物のスクリーニング実験を行いました.

感染症の原因ウイルスを通常マウスに接種した場合,そのマウスの生存率は60%です.

しかし,ある化合物で処理すると,その生存率が90%に改善するという別の報告がありました.

そこで…

マウスの生存率を上昇させる他の化合物を探そう!

という目的で実験で行いました.

実際は,指導教官がスクリーニングを終えており,すでに化合物Aを見つけていました.

だから正確には,私はその再現性確認実験を行ったことになります.

検定の手順

  1. 設問:化合物Aの有無で,マウスの生存率の違いを調べる.
  2. 帰無仮説:化合物Aを投与しても,マウスの生存率は60%のままである.
  3. 対立仮説:化合物Aを投与すると,マウスの生存率は60%以上になる.
  4. データを集める.
  5. 帰無仮説が正しい確率pを算出する.
  6. 確率pと有意水準αを比べる.
  7. 結論を考える.

以下は,集めたデータ*です.

  • マウスの匹数(n):20
  • 一般的なマウスの生存率(p):0.6
  • 生存したマウス:17

*諸事情により実際のデータは使えないので(笑),私が架空の内容を設定しました.

スポンサーリンク

解析を行う前に考えること

データが名義変数の場合も,いきなり解析を実施してはダメです!

今回も解析を行う前に考えることをまとめました.

  • データの種類
  • データ間の対応
名義変数の検定 二項分布 ポアソン分布 マクマニー法 カイ二乗検定 Fisherの直接検定
データの特徴 名義変数 名義変数 名義変数 名義変数 名義変数
データの種類 1種類 1種類 2種類 2種類 2種類
データ間の対応 無し 無し 有り 無し 無し
サンプル数(n)

×確率(p)

np<5
or
n(1-p)<5
np<5
or
n(1-p)<5
サンプルサイズ <50 >50
期待値 >5 <5

今回の場合,データの種類は生死の判定だけなので1種類です.

また,データ間の対応もありませんので二項分布またはポアソン分布を使うことになりますね!

サンプル数が20で,マウスの生存率が60%なので, “n×p = 1.2” および “n×(1-p) = 0.8” です.

よって,今回使う解析方法は,二項分布になります.

二項分布

さて,いよいよ本題です.

Excelには二項分布の確率を算出する関数式がありますので,計算は簡単ですよ!

Excelで二項分布の解析

BINOM.DIST関数を使うと,事象(今回の場合は生存数が1匹~20匹)の確率を計算できます.

最後の引数を “TRUE” にすると,生存数0から該当する生存数までの累積確率を計算します.

生存数は17匹だったので,その確率pは0.012でした.

有意水準(α=0.05)よりも小さいですね!

これは有意水準5%で帰無仮説を棄却することを意味します.

つまり,対立仮説の「化合物Aを投与すると,マウスの生存率は60%以上になる」を採用することになります.

スポンサーリンク

もっと勉強したい方へ

  • 医統計テキスト

医療関係者向けの生物統計学の教科書です.少し古いですが,例題も多く,また数学が嫌いな人でも読み進めることができると思います.

  • バイオサイエンスの統計学

自然科学で使うことが多い検定法を解説している本です.こちらも少し古いですが,誤った解析例も載っているため検定の正しい使い方を学べます.


データが名義変数且つデータの種類が1つの場合の統計解析方法をまとめてみました.

次回は,ポアソン分布を使った統計解析の方法をまとめますね!

最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2021年2月23日 フール

error: Content is protected !!
タイトルとURLをコピーしました