アミノ酸配列の比較方法【SARS-CoV2の変異種を使って】
SARS-CoV2の変異種が多数報告されているね.具体的にどこが変わっているのかを確認する方法はあるのかな?
本記事は,このような「なぜ?どうして?」にお答えします.
こんにちは.
博士号を取得後,派遣社員として基礎研究に従事しているフールです.
皆さんは,核酸やタンパク質の配列のアライメントをとったことがありますか?
共通領域を探したり,逆に既存の報告とどこが違うのかを探したりするときに配列のアライメントをとる方法を知っておくと便利ですよ.
この記事では,Clastal OmegaとExcelを使ったタンパク質配列のアライメント方法をまとめました.
今回は例として,SARS-CoV2の変異種の配列をサンプルとしました.
本記事を読み終えると,核酸やタンパク質の配列をアライメントする方法が分かりますよ!
サマリー・手間はかかりますが,有償ソフトウェアを使わなくても配列データをまとめることができます.
Clastal Omega
複数の塩基配列やアミノ酸配列をアラインメントするツールはたくさんあります.
私は,職場では “Genetyx” を使っています.
でも, “Genetyx” は有料です.
だから,プライベートでは,無償で使えるClustal Omega(クラスタルオメガ)を使っています.
Clastal Omegaの使い方
ブラウザで “Clustal Omega” と検索してみましょう.
トップに出てきたものをクリックすると,次のサイトに移ります.
Step1で配列が核酸かアミノ酸かを選びます.
そして,比較したい配列をコピー&ペーストするか,それらをまとめたテキストファイルをアップロードします.
配列データはNCBIなどのデータベースからダウンロードしましょう!
今回,私が使った配列のAccession IDは,以下の通りです.
- YP_009724390またはQHD43416
- QJZ28203
- QMU92484
- QQE14139
比較したい配列をコピー&ペーストで貼り付けたら,Step2で詳細設定をします(今回は省略します).
そして,Step3で “submit” を押すだけです.
もし,配列データが膨大な場合は, “Be notified by email (Tick this box if you want to be notified by email when the results are available)” にチェックを容れましょう.
解析が終わったら,その旨をメールでお知らせしてくれます.
Clastal Omegaの結果の見方
今回は配列数が少なく,配列の内容もほとんど同じなので,5秒くらいで解析が終わりました.
解析結果は,マーク( “*” , “:” ,”.” )または空欄で示されます.
・"*" は,アミノ酸が完全に一致していることを意味します. ・":" は,アミノ酸の類似性が強いことを意味します. ・"." は,アミノ酸の類似性が弱いことを意味します. ・空欄は,アミノ酸の類似性が無いことを意味します.
Javaをインストールしている人は,”Results Viewers” からアライメント結果を視覚で認識することが可能です.
でも私はJavaをインストールしていないので,Excelでまとめています.
Clastal Omegaの結果をExcelでまとめる
“Download Alignment File” をクリックします.
出てきた画面を全選択して,コピー&ペーストでテキストに貼り付けます.
テキストファイルとして保存し,それをExcelから開きます.
すると次のような画面になります.
「スペースによって右または左・・・」を選択し,「次へ」をクリックします.
説明にあるように,区切りたい位置(アミノ酸1文字ずつ)でクリックすると矢印(↑)が挿入されます.
全部に矢印(↑)を挿入して,「次へ」をクリックします.
列のデータ形式を文字列に変えて「完了」をクリックします.
すると,次のような画面になります.
先ず,この状態で「名前を付けて保存」して拡張子を “.xlsx” 下さい.
「名前を付けて保存」しないと, “.text” のままなので編集データを保存できません.
次に,フォントや文字サイズなど編集していきます.
今回は,文字サイズを10にし,フォントを “Arial narrow” にして,幅も自動調整で整えました.
こんな感じになります↓
最後に,配列に関する情報を加えていきます.
今回は単純な配列比較が目的なので,異なるアミノ酸を強調するだけにしました.
手間はかかりますが,例えば,次のような情報を追加すると良い思います.
- 二次構造情報の追加
- アミノ酸の相同性による分類
- 注目するアミノ酸残基の着色
Excelでまとめた結果をpptスライドに貼る
最後に,完成したアライメントをにpptスライドに貼る方法をまとめます.
必要な部分を範囲選択して, “Ctrl + C” でコピーします.
PowerPointを開いて,「貼り付け」で「形式を選択して貼り付け(S)」を選びます.
「図(拡張メタファイル)」を選択して “OK” をクリックすれば完了です.
少々手間はかかりますが,有償ソフトウェアを使わなくても配列データをまとめることはできますよ!
学校や職場に行かず,自分のパソコンで作業したい方にはオススメです.
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2020年12月29日 フール