運だけ研究生活

渦鞭毛藻、略して「うずべん」を研究しています。研究者の方向けの内容にはならないとおもいます。悪しからず。

力技

随分前からやっていたトランスクリプトーム解析が仕上げの段階に入っている。

夏の半ば頃には大体の方向性は見えていたのだが、その後色々あって詰めの部分が終わっていなかった。
以前から筆者は「対象の遺伝子が葉緑体に輸送されているかどうか」を判別する方法について試行錯誤していた。signalPやASAFindといったソフトを使ってみたが、あまり上手くいかなかった。
結局、間違いなく葉緑体で機能している光合成関連の遺伝子などは良いとして、それ以外の遺伝子については片っ端から分子系統解析して判別するしかないということになった。この大量の分子系統解析を最近まで後回しにしていたのだった。

分子系統解析は、目的の遺伝子の配列を、他の生物が持っている同じ遺伝子の配列と比較することで行うものである。例えばうずべんの遺伝子Aを解析しようとした場合、他の生物が持っている遺伝子Aの配列データを大量に引用し、その中でうずべんの遺伝子Aがどの位置にあるのかを見ることになる。
様々な生物に由来する同じ遺伝子の配列を綺麗に並べてまとめる作業をアライメントと呼ぶ。また、そうしてできあがった配列データをアライメントファイルと俗に呼ぶ。

このアライメントの作業は結構大変である。なにせ1つの遺伝子につき何十種類もの生物の配列を引用する必要があり、特に今回はそれを十種類以上の遺伝子でやらなければならない。
しかも、今回対象とする遺伝子は今まで筆者が扱ったことのないものばかりであり、アライメントは全て一から自作する必要があった。

幸い、色々調べたところ、広範囲の真核藻類の遺伝子がオーソログ(同起源の遺伝子)ごとに小分けにされて公開されている都合のいいデータセットを見つけたので、これを丸ごと使うことでかなりの作業を短縮できた。しかも葉緑体ターゲティングの遺伝子にはタグまで付けられていた。神か?
このデータセットが公開されたのが今年に入ってからだったようなので、とても運がいい。

とはいえこれだけだと今回の解析のためのアライメントファイルとしては不十分なので、さらにデータベースから遺伝子を引用して完成させていった。

かなりゴリ押し気味ではあるが、とりあえず一通りのアライメントファイルを揃えることができた。
あとはこれを分子系統解析にかけるだけだ。これはパソコンが計算してくれるので、筆者はパソコンが途中で壊れないのを祈るだけである。