June 14, 2010

発現量の多いノンコーディングRNA,,,

先日の泊さんのエントリーからずっと気になっているのですが、発現量が多いノンコーディングRNAがどれぐらい普通にみられるのか、Affymetrixのマウス3' expression arrayでマウスの脳の遺伝子発現を調べたデーターを、ちょっと見直してみました。

このアレイでは、大体39,000種類の遺伝子に対して合計約45,000種類のプローブがデザインされています。このうち、機能が推定できるタンパク質をコードしていない、いわゆるRIKENXXXXXGeneという名前が付いている遺伝子に約7000種類のプローブがデザインされています。広範な神経系で強く発現しているNカドヘリンが2,136番目に強いプローブだったので、これよりも発現量が多いRIKENXXXX遺伝子の数を数えてみると、93種類でした。でも、それらをよくよく見直しててみると、多くのものは既知のタンパク質をコードしていて、有意な読み枠が見つからない、もしくは長い読み枠が見つかるけれども既知のタンパク質に相同性を示さない物は24種類でした。ちなみにその中で3番目に強い遺伝子がGomafuです。

この数をどう見るか、微妙なところです。おおざっぱに言うと、マウスの脳における発現量上位5%の遺伝子をとってくると、そのうちの99%は既知のタンパク質をコードしている、ということになります。たった1%「しか」ノンコーディングRNAの候補がない、と考えるのか、1%「も」あると考えるのか。もちろんAffymetrixのexpression arrayにのっていない遺伝子も沢山あるわけで(そもそも3' expression arrayではmiRNAには基本的にプローブがデザインされていない)、RNAseqをやっている人の実感はどうなのでしょう。

ヒトやマウスで見られる大量のノンコーディングRNAは、種類としては沢山あるけれども、発現量の多いものはそれほど無い、けれどもそれらは高等脊椎動物特異的な重要な機能を果たしている、というのが目下の僕の作業仮説なのですが、ほんとのところはどうなのでしょう。それほど無いのなら全部ノックアウトマウスを作って表現型を調べてしまえ、という単純な発想しかできないところが悲しいところなのですが、まあ、そういう仕事をやる人も必要でしょう。でも、この手の「高発現量ノンコーディングRNA」が酵母や線虫やショウジョウバエでどれぐらいあるのか、恥ずかしながら良く知らないです。どなたか知っている人がいたら教えて下さい。遺伝学的な仕事にマウスがそれほど向いているわけではありませんから。。。

中川

6 comments:

  1. やっぱり1%「も」あるっていうのは大事だと思いますし、ノックアウトを作って個別に表現型を調べる+(可能であれば)生化学的にRNPの組成を調べるという方法が、現在のところ最良であるということに変わりはないように思います。 泊

    ReplyDelete
  2. ハエでncRNAをやっていますが、量的な解析をしたことがないので、残念ながら答えられないです、すいません。ハエのRNA-seqのデータは最近データベース(FlyBase)に組み込まれましたので、入手可能だと思います。論文は残念ながらまだ出ていないようです。

    ちょっと気になるのは、DNA arrayでもRNA-seqでも、RNAを抽出する材料を何にするかによって結果が変わってくる点で、組織ごととってくるなら(ハエだと器官あるいは個体丸ごとです)、細胞種特異的に発現している遺伝子は評価されないかもしれません。マウスだと丁寧に解剖してやればよいのかもしれませんが、ハエだと結構効いてくるかもしれません。

    ReplyDelete
  3. ncRNAが発現の高い遺伝子の中の1%しかないというのは、RNAは細胞の構造を作るような材料には向いていないということなんじゃないでしょうか。RNAの構造は熱力学的に不安定なので、アクチンのように足場になるような部分は、進化の過程でタンパク質に置き換わってしまうのかもしれません。

    あるいは単に、ncRNAのほとんどはジャンクであるため、発現量が高いもの(意味のあるもの)が少ないということかもしれませんが...

    影山

    ReplyDelete
  4. 組織特異的に発現しているncRNAを見落してしまう、という点は重要だと思います。僕自身アレイのデーターを眺めていてビックリしたのは、ざっくりと取ってきた組織や培養細胞ではelongation factorなりubiquitinなりactinなりがトップ10の常連なのですが、かなり均一なpureな神経細胞集団である海馬培養だと、シナプス関連が上位に来るのですよね。筋肉がアクチンとミオシンだらけなのと同様、神経細胞はシナプスだらけ。ついでにMalat1だらけ。食べたらncRNAの味がしたりして。

    ちなみにフランス料理に羊の脳があるみたいですが、ありゃグリア由来のミエリンと脂肪の味でしょうね。

    中川

    ReplyDelete
  5. タンパク質の場合もそうだと思うのですが、細胞中において、ncRNAが局在「場所」が重要である場合には、全体としてみたときの発現量はそんなに重要ではない気がします。
    発現量が低いものというのはつまり、該当する転写物が、某かの「特化」した機能を持っている、ということを示唆しているのではないでしょうか。
    場所、タイミング(時期や刺激によっては高発現、なんてやつもいるんですよね、きっと)、さまざまな条件が揃った場合にのみ、限られた仕事をする、ということです。

    量が少ないということはそれだけ、確率的変動の影響を受け易いように思うので、もしかすると、汎用性の高い部品たちよりも、多様性、進化の駆動力になるケースが多いのかしら、なんて妄想してみました。

    とにかく、そういう意味では、全体としてみたときの発現量が多ければ「重要」、というのは、考えにくいんじゃないでしょうか。

    かわおか

    ReplyDelete
  6. 何も特化しているものの方が重要なわけではないでしょう。攻め津にとって、細胞にとって大事なものは、やはり各細胞において高発現していておかしくないので、上位にくるものの性状がわからなければ、それは是非研究すべきだと思います。発生に片足突っ込んでいると、細胞種毎に違った因子が効いていることの方が説明しやすいので、そういった遺伝子の方が好まれますが、そもそも単細胞生物にはそんなものはいらないわけですし、どこに重要性を求めるかというような好みの問題のような気がします。もっとも、もともとやりたい遺伝子が別の理由で決まっている場合はこのような議論は意味がないのですが。

    影山裕二

    ReplyDelete