運だけ研究生活

渦鞭毛藻、略して「うずべん」を研究しています。研究者の方向けの内容にはならないとおもいます。悪しからず。

緩歩

トランスクリプトームデータの処理が最近少し進んだ。

3月頃の時点で、筆者によるトランスクリプトームデータの解析は、「発現していた全ての遺伝子がリストアップされた」という段階まで来ていた。一見もうゴールみたいな感じがするが、まだである。これでは依然データ量が膨大すぎて、人力での処理が追いつかない。
ここから先の解析は研究の目的によって異なる。筆者の場合は葉緑体機能や光合成能力に興味があったので、「発現していた全ての遺伝子」からさらに「葉緑体で機能する遺伝子」を絞り込む必要があった。

で、それから5月まで筆者はサボっていた。

6月に入って重い腰を上げた筆者は、まず解析ソフトのインストールとテストランを始めた。

葉緑体で機能する遺伝子をソートするために、以下の処理を計画している。
まず、「signalP」を使って、全ての遺伝子からシグナル配列を持つものだけを選抜する。シグナル配列とは、タンパク質の輸送と局在化を担うアミノ酸配列…つまり、このタンパク質はこの場所に輸送してくださいね〜という指示を行うパーツのことである。
シグナル配列には、葉緑体への輸送を指示するものだけでなく、当然それ以外の場所への輸送を指示するものもある。よって、signalPによって選抜された遺伝子から、葉緑体へ輸送されるものをさらにソートする必要がある。これには「ASAFind」というツールを使う。葉緑体輸送シグナルにASAFというアミノ酸配列モチーフがあることがこの名前の由来らしい。
これによって、晴れて葉緑体で機能する遺伝子を絞り込むことができる。
この後の処理はまだ調べきれていないが、KEGG pathway databaseあたりのツールを使ってどの遺伝子がどの代謝経路で機能しているかをマッピングしていこうと考えている。

ということで、目下の目標はsignalPとASAFindを使えるようになることだった。
ここ数日はこれらのソフトウェアによるバグとエラーとの戦いだった。この手のソフトウェアは基本的にLinuxでのコマンドラインで動くので、コマンドでの操作に慣れていない筆者にはとても苦しい。

そして今日、テストランに成功した。一部のデータから葉緑体機能遺伝子をソートすることに成功したのである。多分。

明日以降は筆者の持っている全てのデータに対して解析をかけていくことになる。一度成功したならあとは同じ操作の繰り返しなので楽勝だ。多分。

少しずつではあるが、目標へ向かって進んでいる感じがする。