アミノ酸配列の比較方法【SARS-CoV2の変異種を使って】

clastal omegaの結果を色分け
この記事は約5分で読めます。

アミノ酸配列の比較方法【SARS-CoV2の変異種を使って】

 

SARS-CoV2の変異種が多数報告されているね.具体的にどこが変わっているのかを確認する方法はあるのかな?

本記事は,このような「なぜ?どうして?」にお答えします.

 

こんにちは.

博士号を取得後,派遣社員として基礎研究に従事しているフールです.

皆さんは,核酸やタンパク質の配列のアライメントをとったことがありますか?

共通領域を探したり,逆に既存の報告とどこが違うのかを探したりするときに配列のアライメントをとる方法を知っておくと便利ですよ.

この記事では,Clastal OmegaとExcelを使ったタンパク質配列のアライメント方法をまとめました

今回は例として,SARS-CoV2の変異種の配列をサンプルとしました

本記事を読み終えると,核酸やタンパク質の配列をアライメントする方法が分かりますよ!

 

サマリー・手間はかかりますが,有償ソフトウェアを使わなくても配列データをまとめることができます.

Clastal Omega

複数の塩基配列やアミノ酸配列をアラインメントするツールはたくさんあります.

私は,職場では “Genetyx” を使っています.

でも, “Genetyx” は有料です.

だから,プライベートでは,無償で使えるClustal Omega(クラスタルオメガ)を使っています.

Clastal Omegaの使い方

ブラウザで “Clustal Omega” と検索してみましょう.

Clustal Omegaを検索

トップに出てきたものをクリックすると,次のサイトに移ります.

Clustal Omegaを使ってみる

Step1で配列が核酸かアミノ酸かを選びます.

そして,比較したい配列をコピー&ペーストするか,それらをまとめたテキストファイルをアップロードします.

配列データはNCBIなどのデータベースからダウンロードしましょう!

今回,私が使った配列のAccession IDは,以下の通りです.

  • YP_009724390またはQHD43416
  • QJZ28203
  • QMU92484
  • QQE14139

比較したい配列をコピー&ペーストで貼り付けたら,Step2で詳細設定をします(今回は省略します).

clastal omegaで解析

そして,Step3で “submit” を押すだけです.

もし,配列データが膨大な場合は, “Be notified by email (Tick this box if you want to be notified by email when the results are available)” にチェックを容れましょう.

解析が終わったら,その旨をメールでお知らせしてくれます.

Clastal Omegaの結果の見方

今回は配列数が少なく,配列の内容もほとんど同じなので,5秒くらいで解析が終わりました.

clastal omegaの解析結果

解析結果は,マーク( “*” , “:” ,”.” )または空欄で示されます

・"*" は,アミノ酸が完全に一致していることを意味します.
・":" は,アミノ酸の類似性が強いことを意味します.
・"." は,アミノ酸の類似性が弱いことを意味します.
・空欄は,アミノ酸の類似性が無いことを意味します.

Javaをインストールしている人は,”Results Viewers” からアライメント結果を視覚で認識することが可能です.

でも私はJavaをインストールしていないので,Excelでまとめています.

スポンサーリンク

Clastal Omegaの結果をExcelでまとめる

“Download Alignment File” をクリックします.

アライメント結果をダウンロードする出てきた画面を全選択して,コピー&ペーストでテキストに貼り付けます.

アライメント結果をコピー&ペースト

テキストファイルとして保存し,それをExcelから開きます.

Excelで配列解析

すると次のような画面になります.

エクセルで配列データをまとめる

「スペースによって右または左・・・」を選択し,「次へ」をクリックします.

エクセルで配列データを区切る説明にあるように,区切りたい位置(アミノ酸1文字ずつ)でクリックすると矢印(↑)が挿入されます.

全部に矢印(↑)を挿入して,「次へ」をクリックします.

列のデータ形式を文字列に変えて「完了」をクリックします.

すると,次のような画面になります.

エクセルでアミノ酸配列をまとめる先ず,この状態で「名前を付けて保存」して拡張子を “.xlsx” 下さい

「名前を付けて保存」しないと, “.text” のままなので編集データを保存できません.

次に,フォントや文字サイズなど編集していきます.

今回は,文字サイズを10にし,フォントを “Arial narrow” にして,幅も自動調整で整えました.

こんな感じになります↓

最後に,配列に関する情報を加えていきます.

今回は単純な配列比較が目的なので,異なるアミノ酸を強調するだけにしました.

手間はかかりますが,例えば,次のような情報を追加すると良い思います.

  • 二次構造情報の追加
  • アミノ酸の相同性による分類
  • 注目するアミノ酸残基の着色

Excelでまとめた結果をpptスライドに貼る

最後に,完成したアライメントをにpptスライドに貼る方法をまとめます.

必要な部分を範囲選択して, “Ctrl + C” でコピーします.

PowerPointを開いて,「貼り付け」で「形式を選択して貼り付け(S)」を選びます.

形式を選択して貼り付ける

「図(拡張メタファイル)」を選択して “OK” をクリックすれば完了です.

少々手間はかかりますが,有償ソフトウェアを使わなくても配列データをまとめることはできますよ!

学校や職場に行かず,自分のパソコンで作業したい方にはオススメです.

スポンサーリンク


最後までお付き合いいただきありがとうございました.

次回もよろしくお願いいたします.

2020年12月29日 フール