qPCRでハウスキーピング遺伝子を定量する理由

EZRでハウスキーピング遺伝子の選定を解析する
この記事は約14分で読めます。

どうして,qPCRでハウスキーピング遺伝子を定量するの?

本記事は,このような「なぜ?どうして?」にお答えします.

本記事の内容・qPCRでハウスキーピング遺伝子を定量する理由

・ハウスキーピング遺伝子の選定方法

フールは元研究者であり獣医師でもある

フールの登場

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

皆さんは,qPCRで遺伝子を定量するときに,どのような方法を採用していますか?

絶対定量(検量線法)でしょうか?

それとも相対定量(検量線法,比較 Ct 法【ΔΔCt法】)でしょうか?

目的遺伝子のコピー数が分かっているコントロールサンプルの用意が面倒なので,相対定量法を採用しているところが多いのではないでしょうか

相対定量法では,ハウスキーピング遺伝子も測定することが多いです.

フールの登場

その理由は何だと思いますか?

「先生・先輩・上司などに測定するように言われたから」と私には関係ないスイッチを押していませんか?

そのままでは,いつまでたっても実験が面白いと感じるようにはなりませんよ!

この記事では,qPCRでハウスキーピング遺伝子を定量する理由ハウスキーピング遺伝子の選定方法についてまとめました.

本記事を読み終えると,qPCR 実験を自分ごと化することができますよ!

サマリー・実験条件の影響を補正するためにハウスキーピング遺伝子を定量します.

・「過去の文献でよく使われているから」などの理由でハウスキーピング遺伝子を選定すると,解釈を誤る可能性があります.

qPCRでハウスキーピング遺伝子を定量する理由

相対定量は基準となるコントロールを用意し, それに対してサンプルの増減がどの程度かを比較する方法です.

よって,相対定量では目的遺伝子のコピー数は分かりません.

また,相対定量では,調べたい遺伝子(標的遺伝子)以外に内在性コントロール遺伝子が必要です*.

理屈では,qPCR で得られる結果は遺伝子の転写量を反映しています.

しかし,実際には,遺伝子の転写量に加えて,以下に示すような実験条件の影響を受けることが分かっています.

  • 持ち込んだサンプルの量
  • 使用した酵素の種類
  • プライマーの特異性
  • プライマー増幅効率

特に「持ち込んだサンプルの量」の違いは結果に大きく影響します.

例えば,ウェル A には 30 ng のサンプル量があったが,ウェル B には 27 ng のサンプル量しかなかったとします.

持ち込み量が異なるサンプル同士で比較したときに,得られた結果は「サンプル量の違いの影響を受けていない」と証明することはできるでしょうか?

フールの登場

残念ながら,それは難しいです!

だから,同量のサンプル量が含まれるようにして実験を開始する必要があります.

しかし,実験者の手技やピペットマンの精度などの影響も受けるため,これもまた難しいのです.

フールの登場

そこで内在性コントロール遺伝子を定量します.

これにより得られた差が事実なのか,それとも持ち込んだサンプルの量の違いを反映した見かけの差なのかを区別します.

① 内在性コントロール遺伝子の転写量は同じだけど,目的の遺伝子の転写量は異なる>得られた差は事実

② 内在性コントロール遺伝子の転写量が異なり,目的の遺伝子の転写量も異なる>持ち込んだサンプルの量が違うから「差」として観察された可能性が高い

そして,qPCR などの遺伝子発現解析では,ハウスキーピング遺伝子が内在性コントロール遺伝子として選択されることが多いです**.

これはハウスキーピング遺伝子が「ほとんどの細胞で共通して一定量転写される遺伝子」と認識されているからでしょう.

フールの登場

以上が qPCR でハウスキーピング遺伝子を定量する理由です.

*絶対定量でも実験者の手技を客観的に評価するために,内在性コントロール遺伝子を定量することがあります.

**合成 RNA や in vitro 転写で調整した RNA をサンプルに混ぜて内在性コントロール遺伝子とすることもあります.ライセートバッファーに加えて使用すれば,RNA 抽出や逆転写反応などのステップも標準化することができます.

スポンサーリンク

ハウスキーピング遺伝子の選び方

先ほど,「ハウスキーピング遺伝子は『ほとんどの細胞で共通して一定量転写される遺伝子』と認識されているから」と書きました.

ハウスキーピング遺伝子は細胞のホメオスタシスを維持するために必要な遺伝子なので,常に転写・翻訳されて細胞の維持・増殖に関与していると考えられています.

しかし,現在ではハウスキーピング遺伝子の転写量も一定の条件下では変化することが明らかとなっています.

フールの登場

つまり,「過去の文献でよく使われているから」などの理由でハウスキーピング遺伝子を1種類しか定量していないと,解釈を誤る可能性があります.

だから,複数のハウスキーピング遺伝子を同時に測定したり,アルゴリズムを使って実験デザインの影響を受けない遺伝子を選択する必要があります.

ただ,論文等でもハウスキーピング遺伝子の選定理由が記述されることは少ないです.

フールの登場

そこで,今回は私が行っている選定方法をご紹介します.

スポンサーリンク

私のハウスキーピング遺伝子の選び方

フールの登場

参考にした論文は,以下の2つです.

  • PFAFFL, Michael W., et al. Determination of stable housekeeping genes, differentially regulated target genes and sample integrity: BestKeeper–Excel-based tool using pair-wise correlations. Biotechnology letters, 2004, 26.6: 509-515.
  • VANDESOMPELE, Jo, et al. Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes. Genome biology, 2002, 3.7: 1-12.

上記の論文では Excel を使って解析しているのですが,実際にそれを行ってみると超大変でした.

フールの登場

マクロ等を組める人であれば簡単かも.

幸い,”BestKeeper” と “geNorm” を統計ソフト R で解析するためのパッケージが公開されていたので,私はそれを使用しています.

無料統計ソフトEZRを使った解析例をにご紹介しますね!

フールの登場

EZRのインストール方法などは以下の記事をご覧ください.

無料統計ソフトEZRの使い方【インストールから解析まで】
記事では無料統計ソフトEZRの使い方をまとめました.ソフトのインストールからデータ解析までを写真を交えながら説明しています.

サンプルの準備

実験データとしては,以下の値を利用します.

Gene_1 Gene_2 Gene_3 Gene_4 Gene_5 Gene_6 Gene_7 Gene_8 Gene_9 Gene_10
Data_1 19.517 19.180 19.575 19.383 19.754 19.816 19.975 19.325 20.153 19.662
Data_2 18.000 18.000 18.000 18.000 18.000 18.000 18.000 18.000 18.462 18.000
Data_3 19.098 18.761 18.978 19.142 18.747 18.906 19.127 18.959 18.910 18.988
Data_4 18.024 18.183 18.260 18.183 18.930 18.188 18.660 18.472 18.472 18.014
Data_5 18.920 19.272 19.855 19.344 19.339 18.877 19.590 18.805 21.401 19.238
Data_6 20.091 19.166 20.414 20.259 19.739 20.197 21.001 19.816 20.943 20.346
Data_7 18.496 18.862 18.843 18.848 18.891 18.679 19.021 18.752 19.161 18.520
Data_8 24.137 24.561 25.371 23.646 23.848 24.691 25.067 24.889 24.089 25.130
Data_9 24.017 23.819 24.186 22.673 23.005 24.393 24.870 24.499 23.367 24.128
Data_10 23.391 23.473 24.499 22.557 22.365 24.186 23.892 23.892 23.429 24.947
Data_11 24.340 24.600 24.812 23.945 23.622 24.735 25.346 24.393 24.287 25.505
Data_12 19.546 19.281 19.609 19.392 19.065 19.373 20.857 19.344 18.771 19.831
Data_13 20.558 20.462 21.204 20.895 18.660 20.722 21.695 20.375 19.045 20.442
Data_14 18.544 19.257 18.805 19.190 19.200 18.963 19.479 19.036 18.761 18.800
Data_15 28.502 29.374 31.344 28.064 27.331 28.352 25.395 27.770 27.384 30.611
Data_16 18.231 18.805 18.318 18.853 18.780 18.385 19.580 18.525 18.737 18.559
Data_17 20.173 19.426 21.117 19.411 19.850 19.811 20.264 19.113 18.000 20.727
Data_18 19.705 20.491 20.423 20.052 19.874 20.760 21.483 20.635 19.065 19.932
Data_19 19.508 20.173 20.081 19.994 20.062 19.672 21.112 19.797 19.065 20.067
Data_20 18.805 19.161 19.190 19.344 19.575 19.050 19.710 18.954 19.609 19.002

数値は Ct 値です.

サンプルは Data_1~20(N = 20)で,ハウスキーピング遺伝子は Gene_1~10 でそれぞれ表現しています***.

フールの登場

上記をエクセルにペーストして, “SampleData” として任意の場所に保存してください.

***サンプルサイズや測定遺伝子の数は大きい方が良いとされています.個人的には, 10 サンプル以上で 5~10 遺伝子を測定すれば良いと思います.

パッケージをインストール

EZR を起動します.

“geNorm” と “BestKeeper” はどちらも標準実装されていない機能なので,それをインストールします.

R Console で以下のコマンドを入力してください.

install.packages(ctrlGene, dependencies = TRUE)

EZRでパッケージをインストール

Enter を押すと,次のような画面が出てきます.

EZRで初めてパッケージをインストールするとき

どちらも「はい」をクリックしてください.

すると,次のような画面が出てきます.

パッケージをインストール

Japan (Tokyo) を選んでください.

パッケージのインストールが終わると,次のような画面になります.

EZRでパッケージのインストール完了

フールの登場

これで準備完了です.

ちなみに,この操作は最初だけで,次回以降は入力不要です.

“geNorm”と”BestKeeper”の実行

インストールしたパッケージを使えるようにするため,そのパッケージを呼び出します.

以下のコマンドを入力してください.

library(ctrlGene)

Enter を押すと「警告」が出ますが,無視して大丈夫です.

以下のコマンドでデータを読み込みます.

CT <- readXL("サンプルデータの保存場所", rownames=TRUE, header=TRUE, na="", sheet="Sheet1", stringsAsFactors=TRUE)

サンプルデータ保存場所は,例えば,デスクトップに置いた場合は次のようになります.

C:/Users/ユーザー名/Desktop/SampleData.xlsx
フールの登場

ユーザー名は各パソコンごとに異なりますので,調べてください.

データの読み込みが成功しているか確認します.

以下のコマンドを入力してください.

CT

データが表示されれば問題ありません.

geNorm アルゴリズムを使用して,最も安定的に発現している遺伝子を決定します.

以下のコマンドを入力してください.

geNorm2(CT, genes = data.frame(Genes = character(0), Avg.M = numeric(0)), ctVal = TRUE)
フールの登場

最後の2つの遺伝子が最も安定なコントロール遺伝子となります.

今回の場合は,Gene_6 と Gene_8 が最も安定なコントロール遺伝子となるはずです.

EZRでBestKeeperとgeNormを解析

BestKeeper アルゴリズムを使用して,Pearson 相関係数を算出します.

以下のコマンドを入力してください.

pearsonCor(CT, ctVal = TRUE)
フールの登場

相関係数が最も大きいものが最も安定なコントロール遺伝子です.

今回の場合は,Gene_6 と Gene_8 の相関係数が最も大きくなっているはずです.

最後に解析結果を出力します.

以下のコマンドで geNorm の解析結果を “result_ct” に格納します.

result_ct <- geNorm(CT, genes = data.frame(Genes = character(0), Avg.M = numeric(0)), ctVal = TRUE)

次のコマンドで “result_ct” を csv ファイルでデスクトップに出力します.

write.csv(result_ct, "C:/Users/ユーザー名/Desktop/geNorm_ct.csv")

ファイル名は “geNorm_ct” としていますが,任意の名前に変更しても問題ありません.

ユーザー名は各パソコンごとに異なりますので,調べてください.

同様の方法で,BestKeeper の解析結果も出力してみましょう.

コマンドは以下の通りです.

・result_r <- pearsonCor(CT, ctVal = TRUE)
・write.csv(result_r, "C:/Users/ユーザー名/Desktop/pearsonCor.csv")

EZRの解析結果を出力

フールの登場

これで EZR での解析は終了です.

異なる2つの方法で同じ結果が得られたので,正確性が高いと判断します.

今後の実験では Gene_6 と Gene_8 を内在性コントロール遺伝子として置くことになります.

スポンサーリンク

qPCRで利用するハウスキーピング遺伝子

ハウスキーピング遺伝子の検討では,「5~10 遺伝子を測定すれば良い」と書きました.

これまで読んできた文献をみていると,qPCR で利用するハウスキーピング遺伝子は,以下のどれかを使っている論文が多いです.

  • ユビキチンC(UBC)
  • β-アクチン(ACTB)
  • シクロフィリンA(CYC)
  • 18SリボソームRNA(rRNA)
  • β-グルクロニダーゼ(GUS)
  • β-2-マイクログロブリン(B2M)
  • TATA-Box結合タンパク質(TBP)
  • ヒポキサンチンリボシルトランスフェラーゼ(HPRT)
  • グリセルアルデヒドリン酸デヒドロゲナーゼ(GAPDH)
  • コハク酸デヒドロゲナーゼ複合体のサブユニットA(SDHA)

内在性コントロール遺伝子の選定では,上記10個を使用すれば良いと思います.

内在性コントロール遺伝子の選定のタイミング

実験デザインが同じ場合は,1度調べれば十分だと思います.

逆に実験デザインに変更が出た場合は,その都度,選定を行った方が良いと思います.

フールの登場

私は,マウスの系統や疾患モデルが変更になったときに使用すべきハウスキーピング遺伝子も変わったことを経験しました.

同じ動物だから(同じ細胞だから)という理由で選定を怠ると解釈を誤るかもしれないと感じました.

もっと勉強したい方へ

Thermo Fisher Scientificが運営するブログが分かりやすいです.

Learning at the Bench
Learning at the Benchはサーモフィッシャーサイエンティフィックが運営するブログです。このブログでは、新しい実験に取り組む方や、既に実験に取り組まれている方向けに...
スポンサーリンク

qPCRでハウスキーピング遺伝子を定量する理由ハウスキーピング遺伝子の選定方法については以上です.

最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2022年3月21日 フール

error: Content is protected !!
タイトルとURLをコピーしました