点推定とか区間推定って考え方は分かるんだけど,実際にどうやって求めるんですか?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・実験データから点推定をエクセルで行う方法
・実験データから区間推定をエクセルで行う方法
こんにちは.
博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.
皆さんは,実験データの解析に必要な統計学を勉強していますか?
学問としての統計学を学んだ人は多いけど,ツールとしての統計学を学んだ人は少ないと思います.
私も冒頭の女性のように思い,イライラしながら教員にクレームをつけたことがあります(笑).
定義や理論は分かるんです!何度も聞いたし!
それしか説明しないけど,じゃ~具体的にどうするんですか?
いやいや,そういう意味じゃなくて…実際に何をどうするのか知りたいんです!「ExcelでCONFIDENCE.T関数を使って」的なことを教えて欲しいんですっ!
そんな経験から弊サイトでは,統計学に関する記事をいくつか公開しています.
今回,その延長でシリーズを作成しようと考えました.
『じゃ~具体的にどうするの?』
これが,皆さんが抱いている「なぜ?どうして?」だと思います(独りよがりだったらごめんなさい).
そこで実験データの具体的な解析方法を記事にしてみました.
この記事では,点推定と区間推定のやり方をまとめています.
本記事を読み終えると,点推定または区間推定の具体的な解析方法が分かるようになりますよ!
サマリー・得られた標本の平均値が点推定値です.
・得られた標本の95%信頼区間が区間推定値です.
チューブの風袋重量を実験データと仮定して統計解析
これは私がラットの臓器サンプリング準備をしていた時の話です.
RNA抽出とWBのために,ラットの臓器を適量採材することになりました.
行った準備は以下の2点です.
- チューブのラベリング
- チューブ(風袋)の重量測定
採材した臓器は1.5 mLチューブに入れるのですが,毎回臓器の重さを測りながら採材を繰り返すのは大変です.
そこで採材前に風袋の重さ測定を行い,採材後に臓器+風体の重さを測って,そこから風袋の重さを引くという作業を考えました.
(臓器+風体)の重さー風体の重さ=臓器の重さ
そして,チューブの風袋重量を測定した時に気づいたことがあります.
チューブの重さがちょっとずつ違うということに.
以下は,実際に測定したチューブ50本の風袋重量(mg)です.
1098.6 | 1086.4 | 1088.0 | 1104.7 |
1103.5 | 1095.9 | 1105.1 | 1101.9 |
1088.2 | 1094.5 | 1103.0 | 1095.3 |
1086.3 | 1099.1 | 1098.2 | 1098.3 |
1099.7 | 1099.8 | 1094.2 | 1093.9 |
1100.9 | 1094.8 | 1086.6 | |
1095.8 | 1094.7 | 1093.2 | |
1096.8 | 1103.6 | 1093.6 | |
1099.2 | 1103.3 | 1095.1 | |
1099.9 | 1085.9 | 1099.3 | |
1096.8 | 1097.2 | 1091.2 | |
1097.2 | 1101.9 | 1095.0 | |
1095.0 | 1091.6 | 1100.6 | |
1094.2 | 1093.4 | 1103.7 | |
1088.9 | 1088.1 | 1094.5 |
平均値は1096.1 mg でした.
また,最小は1085.9 mg ,最大は 1105.1 mg で,その差は19.2 mg です.
チューブ全体の平均値はいくらかな?
チューブは1000本入でしたが,さすがに全部の風袋重量を測るほど私も暇ではありません.
そこで,今回のデータを標本データとして,チューブの風袋重量の点推定と区間推定を行うことにしました!
点推定と区間推定
背景と目的を簡単にまとめます.
- チューブの風袋重量にバラつきがあると分かった.
- 全チューブ(1袋に1000本)の平均風袋重量が知りたい.
- でも,全部を測定するほど時間も体力もない.
- ランダムに抽出した50本(標本)から1000本(母集団)の平均風袋重量を推定してみよう!
材料と方法
使用するのは,以下の2つです.
- 私が測定した50本分の風袋重量
- Excel
実験データを解析時に確認する15個の指標
先ず15個の指標を計算しました.
中央値と算術平均値がほとんど同じで,尖度・歪度ともに-1.5~1.5の範囲なので,この標本は正規分布していると仮定できますね!
点推定
それではチューブの平均風袋重量を推定する点推定を行いましょう!
これは簡単です!
なぜなら,標本データの平均値が点推定値だからです.
よって,チューブ1000本分の平均風袋重量は1096.1と推定できます.
ちなみに,標準誤差(SE)をつける人もいます.
SEは,母集団から無作為に抽出した標本集団における平均値のバラつきです.今回の場合は,チューブ1000本分の平均風袋重量は1096.1±0.74 (mg) となります.
区間推定
続いて区間推定です.
点推定は,文字通り一点のみの推定です.
だから,実際の(1000本分の)平均値とはズレている可能性もあります.
それでは心もとないので,平均値が含まれる範囲を推定する方法(区間推定)を行う場合が多いです.
そして,ココで求めるのは95%信頼区間(95% CI)です.
今回は,母集団(1000本)のデータが無く母集団の分散が未知なので,標本データから母集団の平均値が含まれる範囲を推定します.
これには2つのやり方があります!
- T.INV.2T関数でt値を求めて,t値と標準誤差を掛ける方法
- CONFIDENCE.T関数を使う方法
どちらでも同じ結果になりますので,好きな方を選んでください!
ココでは両方を紹介します.
これでチューブ1000本(母集団)の平均値は,1094.6~1097.6 (mg)にあると推定できました.
実験データではありませんが(笑),点推定と区間推定のやり方をまとめてみました.
次回もチューブのデータを使って統計解析の方法をまとめますね.
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2021年1月23日 フール