塩基配列のデータを扱うときは専用エディタ ApE を使おう


塩基配列のデータを扱うときは MS Word じゃなくて ApE を使おう。という話


ApE を使おう

ApEとは

その名も A plasmid Editor という事で、プラスミドのためのテキストエディタです。とはいえプラスミド以外の塩基配列も扱うことができる優れたソフトです。現在は無料で公開されており、Windows でも Mac でも使うことが出来ます。

MS Word ではダメなのか?

「餅は餅屋」ということで、ApE をはじめとした専用のエディタには塩基配列の編集に適した機能が豊富に備わっています。MS Word でも同じようなことは出来ますが、無駄な時間と変な工夫をしなくても済むならそちらを使った方が良いでしょう。間違いも少なくなります。

ApEのインストール

早速、インストールしましょう。
ここから使っているOSのロゴをクリックしてダウンロードしてインストールする。

ApEの初期設定

最初にこれだけは設定しておくと良いです。
メニューから設定画面を開く。Mac だと [ApE] ->  [Preference](⌘ + ,)。Windows だとたぶん [Edit] か [Tools] から [Preference]。

[Files]タブから、ファイル形式を GenBank、拡張子を .gb にしておく。(もとからこの状態かもしれないけど念のため確認)
Save Files in Format: GenBank
Default File Extension: .gb

Genbank 形式のファイルを編集してみる

Addgene のサイトから pUC18 ベクターの .gb ファイルをダウンロードしてみましょう。適当なファイルがある方はそれで試して下さい。
https://www.addgene.org/browse/sequence_vdb/4490/

[Sequence] タブから [Genbank] を選択すると、GenBank 形式の配列が表示されます。配列をクリックしてから、Ctrl + A、Ctrl + C ですべて選択してコピーしてください。

ApE を起動すると空のファイルが表示されるのでそこに先程コピーした配列をコピーしてください。保存先を聞かれるので適当なフォルダに保存して下さい。

ApEのココが凄い!

検索が便利

例えば Word やメモ帳で TGTGCTGCAAGGCGATTAAGTTGGG という配列の中から CAA という配列を検索(Ctrl + F)すると簡単に見つかります。ところが、ATC という配列を探すとなると見つかりません。塩基配列を扱う際には逆相補鎖も検索できると非常に便利です。ApE で検索する際に [also find rev-com of string] にチェックを入れておくと、逆相補鎖である GAT という配列も同時に検索してくれます。
さらに、プライマーを設計する時に「似た配列についてしまわないかな?」と気になったら、[Allow mismatches] に数字を指定すると検索する配列の内 n ヶ所だけ違う配列も見つけてくれます。


配列の情報が簡単に表示される


編集中の配列の一部をマウスで選択すると、ウィンドウ上部に選択中の配列の情報が表示されます。左から…
Sequence: 編集中の配列の全長
Start: 選択中の配列の先頭位置
Length: 選択中の配列の長さ
End: 選択中の配列の最後尾の位置
ORF: ATG から始まっている場合は M、終止コドンで終わっている場合は * が表示される。
Tm: 選択中の配列の Tm 値
%GC: 選択中の配列の GC 含有量

コピー&ペーストも機能が豊富

通常のコピー&ペーストのショートカットキーである Ctrl + C または Ctrl + V に加えて Shift キーを一緒に押すと逆相補鎖のコピー&ペーストができる。これでプライマーを発注するときも打ち間違いの心配がない。

GenBank形式でアノテーションできる

任意の配列を選択した状態でメニューの[Features] -> [New Feature...](Ctrl + .)を押すとその部分にアノテーションをつけることが出来ます。これを使って、遺伝子のORF、プライマーの位置やタンパク質の機能ドメインの位置などを示せます。逆相補鎖の場合は右上の [Rev-Com] にチェックを入れると反映されます。アノテーション名に全角文字を使うと環境によっては読み込めないので、半角で記入すると良いです。
Feature type: 配列の種類を指定できます。正式な書類で無ければデフォルトのままで良いでしょう。
Forward/Reverse color: マーカーの色を指定できます。右側の [Facorites] から色のセットを作ることができるので、ORFはこの色、イントロンはこの色、プライマーはこの色などと決めておくと見やすいでしょう。


Word で色をつけても同じようなことはできるので良いんですが、他人が見た時に意味がわからないのであまりおすすめしません。(半年後の自分でさえ「この黄色のマーカーはどういう意味だっけ…」となるので)

制限酵素サイトを簡単に探せる

メニューから [Enzymes] -> [Enzyme Selector...] (Ctrl + E, Enzyme の E)を押すと制限酵素の一覧表が出てきます。この画面で左下の [Select Enzymes] から [unique (1)] を選択した状態で [Select] を押すと、編集中の配列に1か所だけ認識配列が含まれる制限酵素が赤く選択されます。酵素名をクリックしても選択状態を変更できます。右下の[Highlight] を押すと、選択されている制限酵素の認識配列がハイライト表示されます。
これを使うと、「3箇所ぐらいで適当に切れる酵素無いかなぁ」というときに便利です。


ベクターマップを表示できる

制限酵素を選択した状態で [Graphic Map] (Ctrl + Y)を押すと、制限酵素サイトと各種アノテーションを含むベクターマップが表示されます。必要な部分だけでも実験ノートに書いておくと良いでしょう。


泳動パターンを計算できる

メニューから [Enzymes] -> [Digestion] (Ctrl + R) を押すと、選択されている制限酵素での切断パターンが表示されます。[Enzymes] -> [Ladder] から普段使っている泳動マーカーを登録しておくと便利です。この機能はとても便利ですが、たまには自分の頭で考えないとボケてくるので要注意。



シーケンサーのデータも読み込める

ABIのシーケンサーを使ったときに出てくる .abi 形式の波形データも読み込めます。

ApEのココがダメ…

見た目が古い

ウインドウの見た目がどことなく古い。

プラスミドマップが見づらい

制限酵素をたくさん選択した時にウィンドウを広げても横に空いたスペースを使ってくれない。

アミノ酸配列は扱えない

ApE に似たソフトの BioEdit はアミノ酸配列も扱えるので便利。(ただし BioEdit は最近更新されていないみたい)


塩基配列のデータを編集するときは MS Word じゃなくて ApE を使おう。という話でした。


コメント

  1. このコメントはブログの管理者によって削除されました。

    返信削除

コメントを投稿

このブログの人気の投稿

Excelで近似直線の傾きと切片を得る

Illustrator で稲妻マークを描く