
どうして,qPCRでハウスキーピング遺伝子を定量するの?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・qPCRでハウスキーピング遺伝子を定量する理由
・ハウスキーピング遺伝子の選定方法

こんにちは.
博士号を取得後,派遣社員として基礎研究に従事しているフールです.
皆さんは,qPCRで遺伝子を定量するときに,どのような方法を採用していますか?
絶対定量(検量線法)でしょうか?
それとも相対定量(検量線法,比較 Ct 法【ΔΔCt法】)でしょうか?
目的遺伝子のコピー数が分かっているコントロールサンプルの用意が面倒なので,相対定量法を採用しているところが多いのではないでしょうか.
相対定量法では,ハウスキーピング遺伝子も測定することが多いです.

その理由は何だと思いますか?
「先生・先輩・上司などに測定するように言われたから」と私には関係ないスイッチを押していませんか?
そのままでは,いつまでたっても実験が面白いと感じるようにはなりませんよ!
この記事では,qPCRでハウスキーピング遺伝子を定量する理由やハウスキーピング遺伝子の選定方法についてまとめました.
本記事を読み終えると,qPCR 実験を自分ごと化することができますよ!
サマリー・実験条件の影響を補正するためにハウスキーピング遺伝子を定量します.
・「過去の文献でよく使われているから」などの理由でハウスキーピング遺伝子を選定すると,解釈を誤る可能性があります.
qPCRでハウスキーピング遺伝子を定量する理由
相対定量は基準となるコントロールを用意し, それに対してサンプルの増減がどの程度かを比較する方法です.
よって,相対定量では目的遺伝子のコピー数は分かりません.
また,相対定量では,調べたい遺伝子(標的遺伝子)以外に内在性コントロール遺伝子が必要です*.
理屈では,qPCR で得られる結果は遺伝子の転写量を反映しています.
しかし,実際には,遺伝子の転写量に加えて,以下に示すような実験条件の影響を受けることが分かっています.
- 持ち込んだサンプルの量
- 使用した酵素の種類
- プライマーの特異性
- プライマー増幅効率
特に「持ち込んだサンプルの量」の違いは結果に大きく影響します.
例えば,ウェル A には 30 ng のサンプル量があったが,ウェル B には 27 ng のサンプル量しかなかったとします.
持ち込み量が異なるサンプル同士で比較したときに,得られた結果は「サンプル量の違いの影響を受けていない」と証明することはできるでしょうか?

残念ながら,それは難しいです!
だから,同量のサンプル量が含まれるようにして実験を開始する必要があります.
しかし,実験者の手技やピペットマンの精度などの影響も受けるため,これもまた難しいのです.

そこで内在性コントロール遺伝子を定量します.
これにより得られた差が事実なのか,それとも持ち込んだサンプルの量の違いを反映した見かけの差なのかを区別します.
① 内在性コントロール遺伝子の転写量は同じだけど,目的の遺伝子の転写量は異なる>得られた差は事実
② 内在性コントロール遺伝子の転写量が異なり,目的の遺伝子の転写量も異なる>持ち込んだサンプルの量が違うから「差」として観察された可能性が高い
そして,qPCR などの遺伝子発現解析では,ハウスキーピング遺伝子が内在性コントロール遺伝子として選択されることが多いです**.
これはハウスキーピング遺伝子が「ほとんどの細胞で共通して一定量転写される遺伝子」と認識されているからでしょう.

以上が qPCR でハウスキーピング遺伝子を定量する理由です.
*絶対定量でも実験者の手技を客観的に評価するために,内在性コントロール遺伝子を定量することがあります.
**合成 RNA や in vitro 転写で調整した RNA をサンプルに混ぜて内在性コントロール遺伝子とすることもあります.ライセートバッファーに加えて使用すれば,RNA 抽出や逆転写反応などのステップも標準化することができます.
ハウスキーピング遺伝子の選び方
先ほど,「ハウスキーピング遺伝子は『ほとんどの細胞で共通して一定量転写される遺伝子』と認識されているから」と書きました.
ハウスキーピング遺伝子は細胞のホメオスタシスを維持するために必要な遺伝子なので,常に転写・翻訳されて細胞の維持・増殖に関与していると考えられています.
しかし,現在ではハウスキーピング遺伝子の転写量も一定の条件下では変化することが明らかとなっています.

つまり,「過去の文献でよく使われているから」などの理由でハウスキーピング遺伝子を1種類しか定量していないと,解釈を誤る可能性があります.
だから,複数のハウスキーピング遺伝子を同時に測定したり,アルゴリズムを使って実験デザインの影響を受けない遺伝子を選択する必要があります.
ただ,論文等でもハウスキーピング遺伝子の選定理由が記述されることは少ないです.

そこで,今回は私が行っている選定方法をご紹介します.
私のハウスキーピング遺伝子の選び方

参考にした論文は,以下の2つです.
- PFAFFL, Michael W., et al. Determination of stable housekeeping genes, differentially regulated target genes and sample integrity: BestKeeper–Excel-based tool using pair-wise correlations. Biotechnology letters, 2004, 26.6: 509-515.
- VANDESOMPELE, Jo, et al. Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes. Genome biology, 2002, 3.7: 1-12.
上記の論文では Excel を使って解析しているのですが,実際にそれを行ってみると超大変でした.

マクロ等を組める人であれば簡単かも.
幸い,”BestKeeper” と “geNorm” を統計ソフト R で解析するためのパッケージが公開されていたので,私はそれを使用しています.
無料統計ソフトEZRを使った解析例をにご紹介しますね!

EZRのインストール方法などは以下の記事をご覧ください.

サンプルの準備
実験データとしては,以下の値を利用します.
Gene_1 | Gene_2 | Gene_3 | Gene_4 | Gene_5 | Gene_6 | Gene_7 | Gene_8 | Gene_9 | Gene_10 | |
Data_1 | 19.517 | 19.180 | 19.575 | 19.383 | 19.754 | 19.816 | 19.975 | 19.325 | 20.153 | 19.662 |
Data_2 | 18.000 | 18.000 | 18.000 | 18.000 | 18.000 | 18.000 | 18.000 | 18.000 | 18.462 | 18.000 |
Data_3 | 19.098 | 18.761 | 18.978 | 19.142 | 18.747 | 18.906 | 19.127 | 18.959 | 18.910 | 18.988 |
Data_4 | 18.024 | 18.183 | 18.260 | 18.183 | 18.930 | 18.188 | 18.660 | 18.472 | 18.472 | 18.014 |
Data_5 | 18.920 | 19.272 | 19.855 | 19.344 | 19.339 | 18.877 | 19.590 | 18.805 | 21.401 | 19.238 |
Data_6 | 20.091 | 19.166 | 20.414 | 20.259 | 19.739 | 20.197 | 21.001 | 19.816 | 20.943 | 20.346 |
Data_7 | 18.496 | 18.862 | 18.843 | 18.848 | 18.891 | 18.679 | 19.021 | 18.752 | 19.161 | 18.520 |
Data_8 | 24.137 | 24.561 | 25.371 | 23.646 | 23.848 | 24.691 | 25.067 | 24.889 | 24.089 | 25.130 |
Data_9 | 24.017 | 23.819 | 24.186 | 22.673 | 23.005 | 24.393 | 24.870 | 24.499 | 23.367 | 24.128 |
Data_10 | 23.391 | 23.473 | 24.499 | 22.557 | 22.365 | 24.186 | 23.892 | 23.892 | 23.429 | 24.947 |
Data_11 | 24.340 | 24.600 | 24.812 | 23.945 | 23.622 | 24.735 | 25.346 | 24.393 | 24.287 | 25.505 |
Data_12 | 19.546 | 19.281 | 19.609 | 19.392 | 19.065 | 19.373 | 20.857 | 19.344 | 18.771 | 19.831 |
Data_13 | 20.558 | 20.462 | 21.204 | 20.895 | 18.660 | 20.722 | 21.695 | 20.375 | 19.045 | 20.442 |
Data_14 | 18.544 | 19.257 | 18.805 | 19.190 | 19.200 | 18.963 | 19.479 | 19.036 | 18.761 | 18.800 |
Data_15 | 28.502 | 29.374 | 31.344 | 28.064 | 27.331 | 28.352 | 25.395 | 27.770 | 27.384 | 30.611 |
Data_16 | 18.231 | 18.805 | 18.318 | 18.853 | 18.780 | 18.385 | 19.580 | 18.525 | 18.737 | 18.559 |
Data_17 | 20.173 | 19.426 | 21.117 | 19.411 | 19.850 | 19.811 | 20.264 | 19.113 | 18.000 | 20.727 |
Data_18 | 19.705 | 20.491 | 20.423 | 20.052 | 19.874 | 20.760 | 21.483 | 20.635 | 19.065 | 19.932 |
Data_19 | 19.508 | 20.173 | 20.081 | 19.994 | 20.062 | 19.672 | 21.112 | 19.797 | 19.065 | 20.067 |
Data_20 | 18.805 | 19.161 | 19.190 | 19.344 | 19.575 | 19.050 | 19.710 | 18.954 | 19.609 | 19.002 |
数値は Ct 値です.
サンプルは Data_1~20(N = 20)で,ハウスキーピング遺伝子は Gene_1~10 でそれぞれ表現しています***.

上記をエクセルにペーストして, “SampleData” として任意の場所に保存してください.
***サンプルサイズや測定遺伝子の数は大きい方が良いとされています.個人的には, 10 サンプル以上で 5~10 遺伝子を測定すれば良いと思います.
パッケージをインストール
EZR を起動します.
“geNorm” と “BestKeeper” はどちらも標準実装されていない機能なので,それをインストールします.
R Console で以下のコマンドを入力してください.
install.packages(ctrlGene, dependencies = TRUE)
Enter を押すと,次のような画面が出てきます.
どちらも「はい」をクリックしてください.
すると,次のような画面が出てきます.
Japan (Tokyo) を選んでください.
パッケージのインストールが終わると,次のような画面になります.

これで準備完了です.
ちなみに,この操作は最初だけで,次回以降は入力不要です.
“geNorm”と”BestKeeper”の実行
インストールしたパッケージを使えるようにするため,そのパッケージを呼び出します.
以下のコマンドを入力してください.
library(ctrlGene)
Enter を押すと「警告」が出ますが,無視して大丈夫です.
以下のコマンドでデータを読み込みます.
CT <- readXL("サンプルデータの保存場所", rownames=TRUE, header=TRUE, na="", sheet="Sheet1", stringsAsFactors=TRUE)
サンプルデータ保存場所は,例えば,デスクトップに置いた場合は次のようになります.
C:/Users/ユーザー名/Desktop/SampleData.xlsx

ユーザー名は各パソコンごとに異なりますので,調べてください.
データの読み込みが成功しているか確認します.
以下のコマンドを入力してください.
CT
データが表示されれば問題ありません.
geNorm アルゴリズムを使用して,最も安定的に発現している遺伝子を決定します.
以下のコマンドを入力してください.
geNorm2(CT, genes = data.frame(Genes = character(0), Avg.M = numeric(0)), ctVal = TRUE)

最後の2つの遺伝子が最も安定なコントロール遺伝子となります.
今回の場合は,Gene_6 と Gene_8 が最も安定なコントロール遺伝子となるはずです.
BestKeeper アルゴリズムを使用して,Pearson 相関係数を算出します.
以下のコマンドを入力してください.
pearsonCor(CT, ctVal = TRUE)

相関係数が最も大きいものが最も安定なコントロール遺伝子です.
今回の場合は,Gene_6 と Gene_8 の相関係数が最も大きくなっているはずです.
最後に解析結果を出力します.
以下のコマンドで geNorm の解析結果を “result_ct” に格納します.
result_ct <- geNorm(CT, genes = data.frame(Genes = character(0), Avg.M = numeric(0)), ctVal = TRUE)
次のコマンドで “result_ct” を csv ファイルでデスクトップに出力します.
write.csv(result_ct, "C:/Users/ユーザー名/Desktop/geNorm_ct.csv")
ファイル名は “geNorm_ct” としていますが,任意の名前に変更しても問題ありません.
ユーザー名は各パソコンごとに異なりますので,調べてください.
同様の方法で,BestKeeper の解析結果も出力してみましょう.
コマンドは以下の通りです.
・result_r <- pearsonCor(CT, ctVal = TRUE) ・write.csv(result_r, "C:/Users/ユーザー名/Desktop/pearsonCor.csv")

これで EZR での解析は終了です.
異なる2つの方法で同じ結果が得られたので,正確性が高いと判断します.
今後の実験では Gene_6 と Gene_8 を内在性コントロール遺伝子として置くことになります.
qPCRで利用するハウスキーピング遺伝子
ハウスキーピング遺伝子の検討では,「5~10 遺伝子を測定すれば良い」と書きました.
これまで読んできた文献をみていると,qPCR で利用するハウスキーピング遺伝子は,以下のどれかを使っている論文が多いです.
- ユビキチンC(UBC)
- β-アクチン(ACTB)
- シクロフィリンA(CYC)
- 18SリボソームRNA(rRNA)
- β-グルクロニダーゼ(GUS)
- β-2-マイクログロブリン(B2M)
- TATA-Box結合タンパク質(TBP)
- ヒポキサンチンリボシルトランスフェラーゼ(HPRT)
- グリセルアルデヒドリン酸デヒドロゲナーゼ(GAPDH)
- コハク酸デヒドロゲナーゼ複合体のサブユニットA(SDHA)
内在性コントロール遺伝子の選定では,上記10個を使用すれば良いと思います.
内在性コントロール遺伝子の選定のタイミング
実験デザインが同じ場合は,1度調べれば十分だと思います.
逆に実験デザインに変更が出た場合は,その都度,選定を行った方が良いと思います.

私は,マウスの系統や疾患モデルが変更になったときに使用すべきハウスキーピング遺伝子も変わったことを経験しました.
同じ動物だから(同じ細胞だから)という理由で選定を怠ると解釈を誤るかもしれないと感じました.
もっと勉強したい方へ
Thermo Fisher Scientificが運営するブログが分かりやすいです.
qPCRでハウスキーピング遺伝子を定量する理由やハウスキーピング遺伝子の選定方法については以上です.
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2022年3月21日 フール