系統樹を見るときのポイントとその解釈の仕方

系統樹の見方がわかりません…
形の違いで見方や解釈は変わりますか?
本記事は,このような「なぜ?どうして?」にお答えします.
本記事の内容・系統樹を見るときに注目するポイントをまとめました.
・系統樹の解釈の仕方を簡単にまとめました.

こんにちは.
博士号を取得後,派遣社員として基礎研究に従事している元研究者のフールです.
皆さんは,系統樹を書いたり見たりすることはありますか?
生物の進化関係や近縁・類縁関係を研究している人にとっては当たり前ですが,その見方や解釈の仕方を記述しているものが少ない気がします.
この記事では,系統樹の見方と解釈の仕方を簡単にまとめました.
本記事を読み終えると,論文等で系統樹に遭遇しても抵抗感がなくなりますよ!
サマリー・無根系統樹は,対象生物の進化関係を考察することはできません.
・葉(OTU)の並び順の変化は読者の見やすさを重視した結果であり,その系統樹が示す内容は変わりません.
・枝の長さの違いが重要な意味を持つ場合と持たない場合があります.
・ブートストラップ値で,系統樹内の各クレードの妥当性を判断することができます.
系統樹で使われる用語
最初に,系統樹で出てくる用語を整理しましょう.
有根系統樹と無根系統樹
系統樹は2種類に大分できます.
根を持つ系統樹を有根系統樹(Rooted tree), 根を持たない系統樹を無根系統樹(Unrooted tree)とそれぞれ呼びます.
アウトグループ(一番古いと分かっているもの)を特定し,アウトグループと残りのグループを分ける枝に根をつけると有根系統樹になります.
この場合,時間軸は左から右です(垂直に表記して下から上にする場合もあります).
有根系統樹は進化関係(時間経過を伴う類縁関係)を示しているので,生物種(ウイルスを含む)の共通祖先を考察することが可能になります.
例えば上図では,A と C の共通祖先よりも A と B の共通祖先が分岐点に近いため、A と B は A と C よりも近縁であると考察できますね.
つまり,分岐の時点の浅さが近縁性を示します.
一方で,無根系統樹は OTU 相互の関連のみを示しているので,進化関係(時間経過を伴う類縁関係)は示していません.
適切なアウトグループを選定できなかったり,自分のサンプルがどのグループに属するのかを可視化して相対的な類縁関係を考察する場合に有用です.
葉(OTU)の並び順
葉(OTU)の並び順が変わっても,系統樹が示す情報に変わりはありません.
例えば,枝のグループを回転させて,系統樹の外観を変更することがあります.
系統樹 1 ~ 3 は系統樹の見た目が変わっているので違うものと考えがちですが,枝を回転させても関連性の程度は変化はありません.

系統樹1ではBとCが近いけど,系統樹2ではBとDが近い
このように OTU の直線距離で判断するのは誤りです.
系統樹内で名前( A ~ E )の位置が近くにあるだけでは,近縁関係を示すことができませんので注意してください.
枝の長さ
枝の長さの意味は,クラドグラム(Cladogram)かファイログラム(Phylogram)かで変わります.
Cladogram では,葉の位置がすべて系統樹の右側に整列しています.
この場合は,枝の長さに意味はありません.
だから,OTU の類似度合についての考察をすることができません.
一方,Phylogram では,枝の長さはその枝分かれの間に起こった変化の量に依存します.
NJ 法で推定している場合は,共通のノードからの長さで類似性の程度を考察できます.
例えば,C と D を分離する枝の長さは A と B を分離する枝の長さより短くなっています.

ここから C と D の類似度は,A と B のそれよりも高いと考察することができます.
MP 法や ML 法を用いて推定している場合は,根から葉までの総枝長を比較することで累積した変異の量を考察することもできます.
例えば,B の総枝長は,C の総枝長よりも長いです.

ここから,C に累積した変異量は多いと考察することができます.
なお,進化速度を評価するには,分子時計仮説などの追加のモデルが必要になりますよ!
ブートストラップ値
共通祖先のノード付近に数値が表示されている場合があります.
これはブートストラップ値(単位は%)です.
ブートストラップ値は,作成した系統樹の信頼性を表しています.

私もその原理を正確に理解はできていません.
というのが正直なところですが(笑),私の理解で説明すると次のようになります.
系統樹を作成するときに必ずマルチプルアラインメント解析を実施します.
- アライメント結果からランダムにサイトをサンプリングします.
- 新しいランダムなアライメントを作成します.
- このサンプリングされたアライメントから系統樹を構築します.
1 ~ 3 を指定した回数(100 ~ 1000)だけ繰り返したときに,同じ分岐を示す系統樹が得られた割合を計算したものがブートストラップ値となります.
系統樹の分岐の一致度を評価していると考えると分かりやすいですね.
だから,ブートストラップ値は高ければ高いほど,その枝の信頼性が高くなります.
系統樹を作成するツールによっては,ブートストラップ値の閾値を設定することが可能です.
閾値設定すると,ブートストラップ値がそれ未満のノードが折りたたまれた系統樹(詳細な分岐を表示しない)を得ることができます.
最後までお付き合いいただきありがとうございました.

今年も幣ブログが大変お世話になりました.
読者の皆様のお陰で,1年間継続することができました.
来年もよろしくお願いいたします.
2021年12月31日 フール