July 12, 2014

Rで行こう!!〜その1

新学術「ノンコーディングRNAネオタクソノミ」領域は発足したものの、班員の間での情報共有、情報発信のやり方はまだ決まっていません。ですので、こちらのほうで、しばらく覚え書きを続けさせていただきます。まずは、「Rで行こう!!〜その1」ということで。

そもそも何故唐突にRかということなのですが、現在Journal of Cell Biologyなどで推奨されている図でエクセルのグラフ機能に無い図をかなり簡単に作れるから、という事に尽きます。ちなみに僕自身は統計についての知識はサッパリですし、Rも、使いこなしている人がイチローなら、少年野球の補欠ぐらいのレベルです。そもそもエクセルで作った図ですら、自分の論文にのせたのは学生の頃は皆無。ポスドクで留学した時の論文がはじめて。しかも、「写真見たら分かるじゃないですか。統計データ集める意味わかりません。」とか言って当時の上司を困らせていた、穴が入ったら入りたい、忸怩たる思いの思い出があります。今から思えば冷や汗ものなのですが、おぬしやる気あるんかと怒鳴り散らさず、心優しいChristineは天使の笑顔で、「もし私があなたのサンプルから統計データを取れと言われればもちろん喜んでやらせていただくわ」。それから数日、黙々と顕微鏡をのぞいて僕のノートにP=0.0000001となるであろう数値を書き込むChristineの背中を見ながら、何を思ったか。。。北風と太陽ではありませんが、今も昔も反省のきっかけになるのは、太陽な方々の背中であると、つくづく思う次第です。反省、反省、反省、、、

反省ばかりしていては前に進めませんので、話をググっとグラフに戻しますと、我々実験系の生物学で一番良くあるパターンのグラフは、コントロールと実験区。平均値と標準偏差。この黄金パターンです。ノックアウトマウスの解析であれば、WTとKO。生化学的な解析であれば、なんたら蛋白あり、なし。生物学的な実験であれば、大体n=2か3でそのようなデータを出してきて、定量した値をグラフで表して、ね、だからこの写真やウエスタンのフィルムの言う通りでしょ、許してね、というパターンがほとんどなのではないでしょうか。

おなじみエクセルで作る典型的な図はこんな感じ。

でも、それで良いのかな?Rならこんな図が簡単に書けます。

というところから始めていきたいと思います。ほんとに単なる恥さらしな覚え書きですが、特にこれからこういう図をやまほど作っていく事になる学生さんには役に立つかなと思いまして。。。

中川

No comments:

Post a Comment