• 木曜日、夏休み前最後のラボセミナーで、Tプロジェクトの解析の途中経過を報告した。あまりクリアな結果が出ているとは言いがたいのだが、まあ生物学の世界ではクリアな結果が出る方がまれである。ただ少なくとも、この転移因子ファミリーのサブファミリーの間には、そのコピー数や、均一性、配列の保存性などの上でかなり大きな違いがあるということだけは明らかなようである。つまりあるサブファミリーでは(おそらく)転移活性を保持している「元気な」、そして非常に均一性の高い転移因子が大量にゲノムに現存している。ところが別のサブファミリーでは、ゲノムの中にそのサブファミリーに由来する断片的な配列は非常にたくさん存在しているものの、それらのほとんどは活性を失った「化石」であり、「元気な」転移因子の割合はかなり低くなっている。均一性も低い。おそらくあるサブファミリーは現役で活発に増幅と転移を繰り返しており、元気なコピーがどんどん供給されているのに対して、あるサブファミリーはかつては高い増幅転移活性を持っていたが、現在ではそれが失われたかあるいはかなり低下していて、かつて増幅したものが崩壊していきつつあるように見える。同じファミリーでこれだけ違うということは、もともと増幅に働く転移酵素が異なっていたのか、あるいは同じ転移酵素を使っていたのだが酵素の変異によってあるサブファミリーへの親和性が低下したのか、いろいろ考えることができて面白い。
  • というわけで進化学会に向けてなんとかデータは形になりつつあるが、進化学会のポスターとして出すためには、かなりデータと表現を洗練して(削って)分かりやすい形にしないといけないだろう。なにせセミナーのレジュメはA3で7枚(それもかなり図を縮小して)になってしまったから、このままポスターにしたのではきちきちに詰め込んでもA0以上になってしまう。それに説明に1時間半もかかってしまったし。
  • セミナー報告と議論の中で気になったことを確認するために、昨日と今日、またスクリプトを書いて全体像を見直している。しかしあれだね、何かアイディアを思いついて、書き捨てのプログラムをちょこちょこと書いて結果を見て、ということを繰り返していると、結局同じようなスクリプトを何度も何度も書くことになってしまって、まあ当然コピー&ペーストという手は使うわけだが、それをやっているとついつい変数名を間違えたり、ひどい場合は前の解析結果のファイルを上書きしてしまったり(orz)することもある。
  • 結局、使い捨ての、特殊な用途のスクリプトを書くのは、その場では早いし結果もすぐに見ることができて良いのだけど、長い目でみれば、汎用性の高そうな作業については、手間がかかってもやはり専用の練られたプログラムをきちんと用意して、それらを使ってスクリプトを作るべきだよなと改めて思った。