
稀に発生する出来事を観察した場合の統計解析ってどうすれば良いのかな?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・Excelでポアソン分布の確率を算出する方法

こんにちは.
博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.
理論や定義よりも実際にどういう操作をするのかを知りたい!
そんな方に向けて,実験データの具体的な解析方法の記事を書いています.
前回に引き続き,データが名義変数の場合についてまとめますね.
この記事では,厚生労働省が公表したワクチンの副反応が疑われる事例数を例にポアソン分布を活用したいと思います.
本記事を読み終えると,ポアソン分布の活用方法が分かりますよ!
サマリー・発生頻度が低い稀な事象の発生を観察した時はポアソン分布を使いましょう!
ポアソン分布の活用
前回の記事で,データが名義変数の場合に考えることをまとめました.
そして,「データが名義変数で,データの種類が1つの場合は,二項分布またはポアソン分布を使う」と書きました.

今回は,ポアソン分布についてまとめまよ~
名義変数の検定 | 二項分布 | ポアソン分布 |
データの特徴 | 名義変数 | 名義変数 |
データの種類 | 1種類 | 1種類 |
データ間の対応 | 無し | 無し |
サンプル数(n)
×確率(p) |
np<5 or n(1-p)<5 |
np<5 or n(1-p)<5 |
サンプルサイズ | <50 | >50 |
期待値 | – | – |
表ではサンプルサイズの違いしか書いてませんが,二項分布との使い分けがもう1つあります.

それは発生頻度の低さです.
非常に大きな母集団を対象にし,且つ,その観察事象が稀にしか起こらない場合にポアソン分布を使います.
例えば,2021年2月26日に厚生労働省が公表したワクチンの副反応が疑われる事例数がそれに該当します.
報告によると,接種回数が21896回で,副反応の疑いの報告は3件*です.
これはサンプル数が21896で,副反応の発生頻度が0.0137%と考えることができます.
n>50で, “n×p = 3” および “n×(1-p) = 21893” となるので,ポアソン分布の解析対象となります.
*接種後の疼痛・頭痛・倦怠感などは,副反応疑いの報告対象になっていません.
検定の手順
- 設問:ワクチンによる副反応の発生頻度を調べる.
- 帰無仮説:ワクチンによる副反応の頻度は0.0137%のままである.
- 対立仮説:ワクチンによる副反応の頻度は0.0137%よりも高いになる.
- 帰無仮説が正しい確率pを算出する.
- 確率pと有意水準αを比べる.
- 結論を考える.
ポアソン分布の解析例

それでは,早速解析していきましょう!
Excelにはポアソン分布の確率を算出する関数式もありますので,計算は簡単ですよ!
POISSON.DIST関数を使うと,事象(今回の場合は患者数が1~20人)の確率を計算できます.
最後の引数を “TRUE” にすると,患者数0から該当する患者数までの累積確率を計算します.
解釈の仕方

本解析の解釈の仕方は以下の通り!
- 患者数が1人以下である確率は,0.1991となります.
- 患者数が10人以上である確率は,1-0.9997 ≒ 0.000292*となります.
*患者数の10人の累積確率を1(100%)から引いた値

有意水準(α=0.05)と比較すると…
- 「患者数が1人以下である」ことは,統計学的に有意ではありません.
- 「患者数が10人以上である」ことは,統計学的に有意です.
仮に同じ規模の集団において,「患者数が10人以上である」が起きた場合は,非常に珍しいことが起きたと考えて,別の調査を進めることになると思います.
もっと勉強したい方へ
- 医統計テキスト

医療関係者向けの生物統計学の教科書です.少し古いですが,例題も多く,また数学が嫌いな人でも読み進めることができると思います.
- バイオサイエンスの統計学

自然科学で使うことが多い検定法を解説している本です.こちらも少し古いですが,誤った解析例も載っているため検定の正しい使い方を学べます.
実験データではありませんでしたが,ポアソン分布の解析方法をまとめてみました.
今回のようなデータを自分で集めて解析するのは難しいですが,データ自体は様々な組織・機関が発表していることも多いです.

あなたの身の回りの出来事についても,データを探して同様に解析してみてはいかがでしょうか?
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2021年2月27日 フール