データが名義変数の場合の解析【実験データの具体的な解析方法】

Excelで二項分布の解析
この記事は約9分で読めます。

データが名義変数の場合の解析【実験データの具体的な解析方法】

 

化合物Aを投与したマウスの生死を判定したんだけど,統計解析をどうすれば良いのかな?

本記事は,このような疑問にお答えします.

 

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

理論や定義よりも実際にどういう操作をするのかを知りたい!

そんな方に向けて,実験データの具体的な解析方法の記事を書いています.

これから数回に分けて,データが名義変数の場合についてまとめます.

例えば,抗体が陽性 or 陰性とか,生存 or 死亡とか,特定の症状の有無とかですね.

今回は,大学にいたころに私が経験したマウスの生死判定*を例に,化合物Aを投与した群と対照群の生存数の比較を行います.

*諸事情により実際のデータは使えないので(笑),私が架空の内容を設定しました.

本記事を読み終えると,データが名義変数の場合でも堂々と統計解析ができるようになりますよ!

 

サマリー・データが名義変数で,データの種類が1つの場合は,二項分布またはポアソン分布を使いましょう!

薬剤の投与がマウスの生存に与える影響

まだ私が学部生だったころ,ある感染症の発症を抑える化合物のスクリーニング実験を行いました.

感染症の原因ウイルスを通常マウスに接種した場合,そのマウスの生存率は60%です.

しかし,ある化合物で処理すると,その生存率が90%に改善するという別の報告がありました.

そこで,

マウスの生存率を上昇させる他の化合物を探そう!

という目的で実験で行いました.

実際は,指導教官がスクリーニングを終えており,すでに化合物Aを見つけていました.

だから正確には,私はその再現性確認実験を行ったことになります.

検定の手順

  1. 設問:化合物Aの有無で,マウスの生存率の違いを調べる.
  2. 帰無仮説:化合物Aを投与しても,マウスの生存率は60%のままである.
  3. 対立仮説:化合物Aを投与すると,マウスの生存率は60%以上になる.
  4. データを集める.
  5. 帰無仮説が正しい確率pを算出する.
  6. 確率pと有意水準αを比べる.
  7. 結論を考える.

以下は,集めたデータ*です.

  • マウスの匹数(n):20
  • 一般的なマウスの生存率(p):0.6
  • 生存したマウス:17

*諸事情により実際のデータは使えないので(笑),私が架空の内容を設定しました.

スポンサーリンク

解析を行う前に考えること

データが名義変数の場合も,いきなり解析を実施してはダメです!

今回も解析を行う前に考えることをまとめました.

  • データの種類
  • データ間の対応
名義変数の検定二項分布ポアソン分布マクマニー法カイ二乗検定Fisherの直接検定
データの特徴名義変数名義変数名義変数名義変数名義変数
データの種類1種類1種類2種類2種類2種類
データ間の対応無し無し有り無し無し
サンプル数(n)

×確率(p)

np<5
or
n(1-p)<5
np<5
or
n(1-p)<5
サンプルサイズ<50>50
期待値>5<5

今回の場合,データの種類は生死の判定だけなので1種類です.

また,データ間の対応もありませんので二項分布またはポアソン分布を使うことになりますね!

サンプル数が20で,マウスの生存率が60%なので, “n×p = 1.2” および “n×(1-p) = 0.8” です.

よって,今回使う解析方法は,二項分布になります.

二項分布

さて,いよいよ本題です.

Excelには二項分布の確率を算出する関数式がありますので,計算は簡単ですよ!

Excelで二項分布の解析BINOM.DIST関数を使うと,事象(今回の場合は生存数が1匹~20匹)の確率を計算できます.

最後の引数を “TRUE” にすると,生存数0から該当する生存数までの累積確率を計算します.

生存数は17匹だったので,その確率pは0.012でした.

有意水準(α=0.05)よりも小さいですね!

これは有意水準5%で帰無仮説を棄却することを意味します.

つまり,対立仮説の「化合物Aを投与すると,マウスの生存率は60%以上になる」を採用することになります.

スポンサーリンク

もっと勉強したい方へ

  • 医統計テキスト

医療関係者向けの生物統計学の教科書です.

少し古いですが,例題も多く,また数学が嫌いな人でも読み進めることができると思います.

  • バイオサイエンスの統計学

自然科学で使うことが多い検定法を解説している本です.

こちらも少し古いですが,誤った解析例も載っているため検定の正しい使い方を学べます.


データが名義変数且つデータの種類が1つの場合の統計解析方法をまとめてみました.

いかがでしたか?

次回は,ポアソン分布を使った統計解析の方法をまとめますね!

 

最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2021年2月23日 フール