抗体価のデータ解析をしたいんだけど,いつものやり方で大丈夫かな?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・エクセルでデータの対数変換のやり方
・対数変換した値を真数に変換する方法
こんにちは.
博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.
理論や定義よりも実際にどんな操作をするのかを知りたい!
そういった方に向けて,実験データの具体的な解析方法の記事を書いています.
今回は抗体価の解析です.
抗体価は測定値が倍々に増加するデータの代表例ですね.
値は倍々に変化するので,データが正規分布することはありません.
だから,データの特徴を表現するときも算術平均値ではなく,中央値や最頻値,または幾何平均値を使います.
それでは95%信頼区間の算出や異なる群間の比較はどうするのでしょうか?
この記事では,値が倍々に変わるデータの解析を抗体価を例にまとめます!
本記事を読み終えると,抗体価など値が倍々に変わるデータの解析もできるようになりますよ!
サマリー・値が倍々に変わるデータの解析では対数変換を行います.
・対数値の平均値など使って,95%信頼区間を算出します.
・対数変換した値のまま,T検定を行って異なる群間の比較を行います.
値が倍々に変わるデータの解析の方法
今回の題材は,大学院生時代に行った家禽(主に鶏)の血清調査で,ワクチンの効果を養鶏場AとBで比較するといった内容です.
全羽調査することができないので,無作為に抽出した15羽から血液を採取し,血清分離しました.
その血清中に含まれる中和抗体価を比較します.
ただ,実際の数値は使えないので,架空の数値を私が設定しました.
使用するデータは次の通りです.
養鶏場A | 養鶏場B | |||
Sample ID | 抗体価 | Sample ID | 抗体価 | |
001 | 40 | 016 | 160 | |
002 | 80 | 017 | 320 | |
003 | 320 | 018 | 2560 | |
004 | 640 | 019 | 160 | |
005 | 40 | 020 | 320 | |
006 | 80 | 021 | 20 | |
007 | 160 | 022 | 40 | |
008 | 1280 | 023 | 160 | |
009 | 80 | 024 | 320 | |
010 | 160 | 025 | 20 | |
011 | 80 | 026 | 40 | |
012 | 160 | 027 | 640 | |
013 | 640 | 028 | 640 | |
014 | 1280 | 029 | 40 | |
015 | 80 | 030 | 80 |
両群ともに,尖度・歪度が-1.5~1.5の範囲を超えており,正規分布を仮定できません.
このようなデータには,算術平均値などを求める解析方法は適用できません.
そこで,これらの値を対数変換します.
データの対数変換のやり方
データの対数変換のやり方は,エクセルで簡単にできますよ!
養鶏場Bのデータに関しても同様に計算してみてください.
対数変換したデータの尖度・歪度は,-1.5~1.5の範囲内で正規分布を仮定できるようになりました.
続いて,平均値や95%信頼区間を算出していきましょう!
平均値や95%信頼区間の算出方法
こちらもエクセルで簡単にできますよ!
養鶏場Bのデータに関しても同様に計算してみてください!
続いて,算出した値を真数に変換していきましょう!
幾何平均値などの算出方法
最後に求めた値を真数に変換します.
これもエクセルで簡単にできますよ!
これで養鶏場Aを代表する数値である幾何平均値*とその95%信頼区間が算出できました!
養鶏場Bのデータに関しても同様に計算してみてくださいね!
抗体価など極端に低い数値または高い数値が含まれるデータの解析では,その数値に平均値が引っ張られます.
そのようなデータに対して算術平均値を求めると,データを代表する数値は得られません!
今回のように対数変換することで,そのようなミスを回避できますよ.
*幾何平均値だけの算出ならGEOMEAN関数を使えばもっと簡単です!
異なる群間の比較
それでは,養鶏場Aと養鶏場Bで中和抗体価に差はあるのでしょうか?
次はそれを比較していきますよ!
使用するのでは,対数変換したデータです.
養鶏場A | 養鶏場B |
3.69 | 5.08 |
4.38 | 5.77 |
5.77 | 7.85 |
6.46 | 5.08 |
3.69 | 5.77 |
4.38 | 3.00 |
5.08 | 3.69 |
7.15 | 5.08 |
4.38 | 5.77 |
5.08 | 3.00 |
4.38 | 3.69 |
5.08 | 6.46 |
6.46 | 6.46 |
7.15 | 3.69 |
4.38 | 4.38 |
両群とも対数変換したデータが正規分布すると仮定できています.
また,詳細は省略しますが,F検定で分散が等しいことも確認できました!
よって,実施する検定はStudentのT検定です!
ExcelでT.TEST関数を使ってみると…確率pは0.69で有意水準α(α=0.05)よりも大きいです.
帰無仮説を棄却できないので,両群の抗体価に有意な差があるとは言えません.
もっと勉強したい方へ
- 4step エクセル統計
計算式の入力をすることなく,統計解析ができる本です.ツールとしての統計を求めている人には最適だと思います.
- 医統計テキスト
医療関係者向けの生物統計学の教科書です.少し古いですが,例題も多く,また数学が嫌いな人でも読み進めることができると思います.
- バイオサイエンスの統計学
自然科学で使うことが多い検定法を解説している本です.こちらも少し古いですが,誤った解析例も載っているため検定の正しい使い方を学べます.
今回は,値が倍々に変わるデータの解析方法をまとめました.
方法が重複する項目は割愛させていただき,文字のみとなる部分もでてきました.
詳細が分からない場合は,以前の記事をご参照ください!
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2021年2月6日 フール