
検定の手順は分かったけど,実際にはどういう操作をするの?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・エクセルでF検定を行う方法
・エクセルでStudentのT検定を行う方法

こんにちは.
博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.
前回に引き続き,実験データの具体的な解析方法の記事を書きました.
今回は2標本による検定です.
以前,検定についての記事も書いたのですが,理論や定義よりも実際にどういう操作をするのかを知りたい人は多いと思います.
この記事では,前回のデータ(チューブの風袋重量)を使って,チューブのロット差を検定してみようと思います.
本記事を読み終えると,2標本による検定のやり方が分かるようになりますよ!
サマリー・2標本による検定にはいくつか各論があり,その違いを理解して使い分ける必要があります.
ロット差を考える【2標本による検定】
さて,チューブ1袋分の点推定と区間推定は前回行いました.
ただ,別の疑問も出てきました.
それは「別の袋の1000本はどうなのか?」ということです.

ロット差はあるのだろうか?
そこで別の袋についても同様に50本分の風袋重量を測定してみました.
私も案外ヒマですね(笑).
以下は,実際に測定した別ロットのチューブ50本の風袋重量(mg)です.
1093.4 | 1101.4 | 1095.4 | 1099.6 |
1095.2 | 1101.4 | 1088.5 | 1099.1 |
1094.9 | 1091.8 | 1096.9 | 1098.2 |
1088.2 | 1101.1 | 1096.7 | 1102.1 |
1094.9 | 1103.6 | 1096.1 | 1099 |
1094.8 | 1100 | 1096.8 | |
1099.5 | 1092.5 | 1097.6 | |
1094.4 | 1101.7 | 1096.5 | |
1101.3 | 1099.8 | 1095.0 | |
1098.8 | 1086.9 | 1095.0 | |
1100.9 | 1095.1 | 1091.5 | |
1096.1 | 1100 | 1100.5 | |
1098.5 | 1103.4 | 1094.9 | |
1100.5 | 1103.7 | 1104.9 | |
1093.4 | 1095.6 | 1091.2 |
最小は1086.9 mg で,最大は 1104.9 mg でした.
その差は18.0 mg です.
15個の指標も計算しました.
結果は省略しますが,中央値と算術平均値がほとんど同じで,尖度・歪度ともに-1.5~1.5の範囲でした.

前回の袋Aと今回の袋Bの間に,平均風袋重量の違いはあるのでしょうか?
検定の手順

ところで,検定の手順は以下の通りです.
- 設問(何を調べるのか?)を考える.
- 帰無仮説を考える.
- 対立仮説を考える.
- データを集める.
- 平均風袋重量やその標準偏差などから統計量を算出する.
- 帰無仮説が正しい確率pを算出する.
- 確率pと有意水準αを比べる.
- 結論を考える.
ただ今回は,順番が前後してしまい,先にデータを集めてしまいました(笑).
また,ステップ5と6はエクセルや統計ソフトが計算してくれるので,数学な苦手な人でも問題ありません!
2標本による検定を行う前に考えること

いきなり,2標本による検定を行ってはいけません!
その前に考えることが4つあります.
- データは間隔変数か?
- データは正規分布していると仮定できるか?
- データ間に対応はあるのか?
- データの分散は等しいか?
2標本による検定にも色々あり,その違いを理解して使い分ける必要があります.
そして,上記4つに対する答えが,その使い分けを判断するのに重要なのです.

それを表にまとめました!
Studentの T検定 |
Welchの T検定 |
対応のある T検定 |
Mann–Whitneyの U検定 |
Wilcoxonの 符号順位検定 |
|
データの特徴 | 間隔変数 | 間隔変数 | 間隔変数 | 間隔変数 順序変数 |
間隔変数 順序変数 |
データ間の対応 | 無し | 無し | 有り | 無し | 有り |
正規分布の仮定 | 出来る | 出来る | 出来る | 出来ない | 出来ない |
等分散の仮定 | 出来る | できない | – | – | – |
データの特徴
測定値の大小や差に意味があるデータを間隔変数と言います.
一方で,測定値の大小だけに意味があるデータを順序変数と言います.
今回の測定値は重量(mg)で,大小や差に意味があるデータです.

よって,今回のデータは間隔変数ですね.
正規分布の仮定
データが正規分布しているかどうかを確認する方法はいろいろあります.
詳細は以下の記事でまとめていますので,ご覧ください.
https://bioresearch-troubleshooting.info/normal-distribution/

今回は尖度・歪度で判断しました!
袋A・袋Bともに尖度・歪度が-1.5~1.5の範囲でしたので,正規分布していると仮定しました.
データ間の対応
「データに対応がある場合」とは次のような場合です.
- 同じ実験動物(被験者)で,化合物の投与前と投与後のデータがある.
- 同じ実験動物(被験者)で,1ヶ月目と2か月目のデータがある.
- 一卵性双生児のペアを追跡調査したデータがある.

今回の袋Aと袋Bは別々のロットなので,対応はありません!
等分散の仮定
データの分散が等しいかどうかの確認はF検定で行います.
これは「検定」なので,前述した検定の手順に従ってすすめていきますね!
1. 設問:袋Aの分散と袋Bの分散の間に差はあるのか?
2. 帰無仮説:両分散に差はない.
3. 対立仮説:両分散に差はある.
4. データを集める:済
5-6. 統計量および確率pを算出する:ExcelでF.TEST関数を使う.
7. 確率pと有意水準α(α=0.05)を比べる:確率pは,有意水準αよりも大きい
8. 結論を考える:帰無仮説を棄却できないので,両分散に有意な差があるとは言えない.
よって,今回は等分散であると仮定できました.

以上より,今回実施する2標本の検定はStudentのT検定になります!
StudentのT検定
さて,いよいよ本題ですね!
袋Aと袋Bの平均風袋重量に差はあるのでしょうか?
それをStudentのT検定により確認します.
これも「検定」なので,検定の手順に従ってすすめていきますよ!
1. 設問:袋Aの平均風袋重量と袋Bの平均風袋重量の間に差はあるのか?
2. 帰無仮説:両群に差はない.
3. 対立仮説:両群に差はある.
4. データを集める:済
5-6. 統計量および確率pを算出する:ExcelでT.TEST関数を使う.
7. 確率pと有意水準α(α=0.05)を比べる:確率pは,有意水準αよりも大きい
8. 結論を考える:帰無仮説を棄却できないので,両平均に有意な差があるとは言えない.

以上より,袋Aと袋Bの平均風袋重量に差はあるとは言えないことがわかりました!
今回も実験データではありませんでしたが(笑),2標本による検定のやり方をまとめてみました.
次回は,ちゃんと実験データを使った統計解析の方法をまとめますね!
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2021年1月24日 フール