2標本による検定のやり方【実験データの具体的な解析方法】

T検定
この記事は約6分で読めます。

2標本による検定のやり方【実験データの具体的な解析方法】

 

検定の手順は分かったけど,実際にはどういう操作をするの?

本記事は,このような「なぜ?どうして?」にお答えします.

 

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

前回に引き続き,実験データの具体的な解析方法の記事を書きました.

今回は,2標本による検定です.

以前,検定についての記事も書いたのですが,理論や定義よりも実際にどういう操作をするのかを知りたい人は多いと思います.

この記事では,前回のデータ(チューブの風袋重量)を使って,チューブのロット差を検定してみようと思います.

本記事を読み終えると,2標本による検定のやり方が分かるようになりますよ!

 

サマリー・2標本による検定にはいくつか各論があり,その違いを理解して使い分ける必要があります.

ロット差を考える

さて,チューブ1袋分の点推定と区間推定は前回行いました.

ただ,別の疑問も出てきました.

それは「別の袋の1000本はどうなのか?」ということです.

 

ロット差はあるのだろうか?

 

そこで別の袋についても同様に50本分の風袋重量を測定してみました.

私も案外ヒマですね(笑).

以下は,実際に測定した別ロットのチューブ50本の風袋重量(mg)です.

1093.41101.41095.41099.6
1095.21101.41088.51099.1
1094.91091.81096.91098.2
1088.21101.11096.71102.1
1094.91103.61096.11099
1094.811001096.8
1099.51092.51097.6
1094.41101.71096.5
1101.31099.81095.0
1098.81086.91095.0
1100.91095.11091.5
1096.111001100.5
1098.51103.41094.9
1100.51103.71104.9
1093.41095.61091.2

最小は1086.9 mg で,最大は 1104.9 mg でした.

その差は18.0 mg です.

15個の指標も計算しました.

結果は省略しますが,中央値と算術平均値がほとんど同じで,尖度・歪度ともに-1.5~1.5の範囲でした.

前回の袋Aと今回の袋Bの間に,平均風袋重量の違いはあるのでしょうか?

スポンサーリンク

検定の手順

ところで,検定の手順は以下の通りです.

  1. 設問(何を調べるのか?)を考える.
  2. 帰無仮説を考える.
  3. 対立仮説を考える.
  4. データを集める.
  5. 平均風袋重量やその標準偏差などから統計量を算出する.
  6. 帰無仮説が正しい確率pを算出する.
  7. 確率pと有意水準αを比べる.
  8. 結論を考える.

ただ今回は,順番が前後してしまい,先にデータを集めてしまいました(笑).

また,ステップ5と6はエクセルや統計ソフトが計算してくれるので,数学な苦手な人でも問題ありません!

2標本による検定を行う前に考えること

いきなり,2標本による検定を行ってはいけません.

その前に考えることが4つあります.

  • データは間隔変数か?
  • データは正規分布していると仮定できるか?
  • データ間に対応はあるのか?
  • データの分散は等しいか?

2標本による検定にも色々あり,その違いを理解して使い分ける必要があります

そして,上記4つに対する答えが,その使い分けを判断するのに重要なのです.

それを表にまとめました!

Studentの

T検定

Welchの

T検定

対応のある

T検定

Mann–Whitneyの

U検定

Wilcoxonの

符号順位検定

データの特徴間隔変数間隔変数間隔変数間隔変数

順序変数

間隔変数

順序変数

データ間の対応無し無し有り無し有り
正規分布の仮定出来る出来る出来る出来ない出来ない
等分散の仮定出来るできない

データの特徴

測定値の大小や差に意味があるデータを間隔変数と言います.

一方で,測定値の大小だけに意味があるデータを順序変数と言います.
今回の測定値は重量(mg)で,大小や差に意味があるデータです.

よって,今回のデータは間隔変数です.

正規分布の仮定

データが正規分布しているかどうかを確認する方法はいろいろあります.

詳細は以下の記事でまとめていますので,ご覧ください.

https://bioresearch-troubleshooting.info/normal-distribution/‎

今回は尖度・歪度で判断しました.

袋A・袋Bともに尖度・歪度が-1.5~1.5の範囲でしたので,正規分布していると仮定しました

データ間の対応

「データに対応がある場合」とは次のような場合です.

  • 同じ実験動物(被験者)で,化合物の投与前と投与後のデータがある.
  • 同じ実験動物(被験者)で,1ヶ月目と2か月目のデータがある.
  • 一卵性双生児のペアを追跡調査したデータがある.

今回の袋Aと袋Bは別々のロットなので,対応はありません

等分散の仮定

データの分散が等しいかどうかの確認は,F検定で行います.

これは「検定」なので,前述した検定の手順に従ってすすめていきますね!

1. 設問:袋Aの分散と袋Bの分散の間に差はあるのか?

2. 帰無仮説:両分散に差はない.

3. 対立仮説:両分散に差はある.

4. データを集める:済

5-6. 統計量および確率pを算出する:ExcelでF.TEST関数を使う.

F検定のやり方

7. 確率pと有意水準α(α=0.05)を比べる:確率pは,有意水準αよりも大きい

8. 結論を考える:帰無仮説を棄却できないので,両分散に有意な差があるとは言えない

よって,今回は等分散であると仮定できました

以上より,今回実施する2標本の検定は,StudentのT検定になります!

StudentのT検定

さて,いよいよ本題です.

袋Aと袋Bの平均風袋重量に差はあるのでしょうか?

それをStudentのT検定により確認します.

これも「検定」なので,検定の手順に従ってすすめていきますよ!

1. 設問:袋Aの平均風袋重量と袋Bの平均風袋重量の間に差はあるのか?

2. 帰無仮説:両群に差はない.

3. 対立仮説:両群に差はある.

4. データを集める:済

5-6. 統計量および確率pを算出する:ExcelでT.TEST関数を使う.

T検定

7. 確率pと有意水準α(α=0.05)を比べる:確率pは,有意水準αよりも大きい

8. 結論を考える:帰無仮説を棄却できないので,両平均に有意な差があるとは言えない

以上より,袋Aと袋Bの平均風袋重量に差はあるとは言えないことがわかりました!

スポンサーリンク

今回も実験データではありませんでしたが(笑),2標本による検定のやり方をまとめてみました.

いかがでしたか?

次回は,ちゃんと実験データを使った統計解析の方法をまとめますね!

最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2021年1月24日 フール