September 28, 2013

若骨にむち打ち(6)マッピングとまとめー雑談抜きの最終回

遠藤さん、前エントリーへのコメントありがとうございました。やはり餅は餅屋。痒い所に手が届くアドバイスとても有り難いです。これからもよろしくお願いします。

さてさて、一応これで準備が全てできたことになったので、いよいよbismarkを走らせます。
$cd /usr/local/bismark_v0.9.0
$./bismark /usr/local/ref/Bisulfite_Genome /usr/local/fastq/CAGATC.fastq
Wikiマニュアルだといろいろパラメータを指定しているみたいですが、とりあえずC>T, A>G変換されたゲノムのファイルが入ったフォルダ(前回のコマンドを走らせるとゲノムが入っていたディレクトリの下位にBisulfite_Genomeというディレクトリが自動生成されるのでそれを指定)を前に、後ろに次世代シークエンスの生データのファイルを直接指定すれば、とりあえず走ってくれるみたいです。パスを指定するのはなにかと面倒くさいので、
$./bismark
だけ打ち込んで、MacOSのファインダーで/usr以下のファイルを表示させておき、あとは該当ディレクトリとfastqファイルをターミナルのウインドウにドラッグアンドドロップすれば完了。

おおっ!待つ事2−3時間で、待望のマップファイル、XXXX.samが生成されているではないか!

あとはこれをビューアで見るのみ。IGVというのが便利らしい。事前にメールアドレスを登録するとダウンロードページから最新版を手に入れる事が出来ます。Launchボタンを押しても良いのでしょうが、せっかくなので本体をダウンロード。Downloadとある欄のzipファイルを普通にダウンロードして、普通に解凍。IGVぐらいになると、だいぶユーザーフレンドリーというか、普段使っているMacのソフトウェアと同じような感覚で使えます。最終的にIGVのブラウザ上で見るためには、まずスペースの節約をするためにsamファイルをbamファイルに変換
$samtools view -bS XXX.sam > XXX.bam
このままではIGVで見る事が出来ないので、bamのインデックスファイルを作成
$samtools index XXX.bam
あとは、IGVのメニューバーのFileからLoad from file...を選んで、XXX.bamを選べば、晴れてマッピングデータをブラウザ上で見る事が出来ます。あ、その前にゲノムを読み込んでおく必要があります。IGVはこのあたりもだいぶMac風なので、適当にメニューバーを見まくっていけば何とかなるのですが、ツールバーのGenomesからLoad Genome from Server...から選べばオーケー。かくして、当面の目的であったbisulfite処理したサンプルの次世代シークエンサーのリードをゲノムにマップしてそれを見る、とういところまで、なんとか、たどり着く事が出来ました。証拠は(2)を参照!

当面は、IGV上で自分の見たいところを見ていけばある程度の情報が得られますし、ゲノムワイドで何らかの解析をしたい!という時でも、まずはIGV上でひたすら眺めながら、なんとなくの傾向をつかんで、それから改めて統計的な解析に進むという事になるのだと思います。統計的な解析を行うためには今度はまた別の壁がある訳ですが、ここまでたどり着いてからバイオインフォマティックスが得意な人に相談すれば、だいぶ会話が通じるのではないか、と思った次第です。

で、今回の教訓ですが、

1)実験屋がつまづいているのは次世代シークエンサーの解析ではなくてUnix/Linuxの使い方。
2)とりあえずググらずに使えるようにならなければいけないUnixコマンドはcdとls。
3)MacのファインダーとUnix/Linuxを動かすターミナルとの相性は抜群。
4)困ったらググる。ネットの向こうの誰かが手を差し伸べてくれている。
5)練習ではモティベーションは高まらない。とりあえずデータを出してもらえばムクムクやる気がわいてくる。
6)本当に難しいところはやはり難しい。ある程度までたどり着いたところで専門家に相談すれば話が通じやすい(はず)。

といったところでしょうか。

次世代シークエンサーの解析は一部のマニアがすることだったのが、今や普通の実験屋が使う技術になりつつあるのだと思います。それだけに、だんだん道のりが整備されてきていてちょっとググればかなり親切なマニュアルが転がっていますし、そのうちボタンを一つ押せば望む解析が出来る、という時代が来るかもしれません。今でもGalaxyなるウェブサーバにfastqファイルを投げれば、適当にいろいろなプログラムにデータを食わせて望みの形のファイルをはきださせる事も出来るみたいです。そういえば、かつてはmultiple alignmentももうすこし面倒くさかったし、プログラムをダウンロードしてきて、自分で作ったfastaファイルを解析し、出てきたファイルを手作業で系統樹に書き直していたような時代もありました。定跡が整備されれば、ある程度の局面まではだれでもたどり着く事が出来るようになります。本当にバイオインフォマティックスで勝負しようと思えば自分でプログラムを書いたり、独自の解析法をうみだしたりしなければいけないのは当然でしょうが、道具として使いこなすという事で割り切ってしまえば、定跡をなぞって問題の局面までたどり着けばそれでよし。

近年は専門分野の細分化が進んできて、どれもこれも自分のところで処理するというわけにはいかなくなってきました。そういう時代だからこそ大事なのは、全てを丸投げするのではなく、幅広い専門分野の基礎の基礎のところについてはきちんと理解する、あるいは理解しようとする姿勢を見せる事なのかもしれません。

よし。今回は雑談なしで終わりました。Riboclub帰りの時差ぼけのおかげでしょうか。うーむ。ちょっと物足りない、、、

RIboclubの感想等は、またおいおい、泊研、影山研、鈴木研、などから出てくる、かな?乞うご期待。酒井さんが「出張ダイエット失敗リターンズ」を執筆してくれる事を期待して、このシリーズ、終了させていただきます。

中川

--
追記
次世代シークエンサー解析を手元のMacでちょっとやってみようという方に、とても良いサイトがあります。最近NGS現場の会のメーリングリストに流れていましたが、大変親切で、しかもすぐに役に立つ情報満載です。
日本バイオデータの緒方法親さんが作られたすぐれもの電子書籍のサイトはこちら
http://www.ipad-zine.com/b/1520/

また、同メーリングリストに慶応の荒川さんからバイオインフォ解析セットの情報も寄せられていました。その名もBioLinux
http://nebc.nerc.ac.uk/nebc/tools/bio-linux
イメージファイルをダウンロードしてMacに放り込めばオーケーということらしいです。こちらのブログ記事が参考になります。

最近ではCLCやAvadisなど、特にUnixの知識が無くても使えるソフトもあるようですので、ますます自分で悩む必要は無くなってきているような気もします。自分のコンピュータで次世代の解析環境を作る、という作業は、まさに分子生物学でいえばミニプレップ、もしくはセシウムを使ったDNA精製だと思います。キットに頼ったり外部委託する前に、最初は自分でやってみないと足腰が鍛えられない。基礎体力がついたら、あとはどんどん便利なツールを使えば良い、ということかなと。

September 21, 2013

若骨にむち打ち(5)ゲノムを入れてBismark始動!

中村さん。レポートありがとうございました。皆様もどんどん、今日のカレーは辛かったでも良いので、エッペン10個だそうと思って袋をふって出したらちょうど10個出てうれしかったでもよいので、情報発信よろしくお願いします!!

さてさて。これで一応、マイマック、次世代シークエンサー、もとい、今世代ジークエンサーの「なんちゃって解析」をする環境が整いました。本当に整っているのかどうか分かりませんが、いけいけGo!Go!です。実験屋をナメではいけません。見通しがつかなくてもとりあえず走り出すことにかけては誰にも負けないっっ!うまく行くかは神のみぞ知るべし。突撃ー!!

とりあえずはbisulfite sequenceのリードをマップするにあたり、0.31秒の検索結果でGoogle先生が指示した次のアクションは、「ゲノムをダウンロードせよ」でした。マウスゲノムは何処にあるのだろう。mouse genome downloadでググれば、どうやらUCSCのサイトから取ってくるらしい。ゲノムの情報以外にも、ESTの情報、遺伝子の上流2kの情報、、、いろいろあります。たとえば既知の転写産物だけにマッピングするのであれば、ESTを使えば良いですし、遺伝子の上流の情報だけ解析したければ、適当なファイルをダウンロードする、ということなんでしょう。便利だ。最新版はmm10のようですが、ちょっといちびって、やっぱりビールはラガーだよと、mm9をダウンロードしてみました。そう。注文はいつでもsecond cheapest。贅沢する時もsecond expensive。とりあえず入れたばかりのwgetで取ってくる事にします。まずは/usr/localの下にrefというディレクトリを作って(当然ここはMacOSのファインダーが便利!)、ターミナルからそこに移動します。$cd /usr/loca/refでいい訳ですが、実は$cd とうったところでファインダーからrefのフォルダーをターミナルの画面にドラッグ&ドロップすると、なんと自動的にそのフォルダへのパスがペーストされるではありませんか!この裏技。すごい。逆転写からPCRまで一本のチューブで出来るぐらいすごい。これもY本師匠がパソコンをいじっているところを眺めながら知ったのですが、そう。技は盗め。先輩の華麗な手つきを背中越しにみながら実験の腕を磨いていった学部生の頃が思い出されます。ともあれゲノムを

$wget http://hgdownload.cse.ucsc.edu/goldenPath/mm9/bigZips/chromFa.tar.gz
で取得して、
$tar xvzf chromFa.tar.gz.1
で展開。なんかいろいろファイルが生成されています。いちいち分割したものにリードを貼付けても面倒なので一つのファイルに統一する、というコマンドをマニュアル通り打ち込みます。果てしなくー♪コマンド、コマンド。

$for i in `seq 1 22` X Y;
$do cat chr$i.fa >> hg19.fa
$done

かつて一世風靡したBasicやFortranだったらFor i=1 to X…nextの構文ですね。はい。なんとなく分かります。分からなくても、分かった事にして、多分これは、いろいろファイルを一つにまとめるという事なんでしょう。実際、このコマンドを入力していくと、mm9.faという、Fastaフォームのファイルが生成されました。ディスクのスペースがもったいないので、元の分割ファイルは全削除!

次はいよいよBismarkの実行です。

まずやらなければならないのは、bisulfuteシークエンスの場合、全てのCがTに変換された(メチル化されていないCは全てTに変換される)ゲノムを別途、用意する事のようです。Wikiに従って、コマンドを入力します。
$ ./bismark_v0.5.4/bismark_genome_preparation ./ref/
うんうん愛しのMacbookair(OS10.7.5, 1.8GHz core i7, memory 4GB)がうなっているので、なんかすごそうな事をしているんだろうと。Wikiに記事を書いておられる方のハイスペックなマシンでも3時間ぐらいかかったと書いてあるので、僕のMBAではもっとかかるんだろうと。もう寝よっと、おやすみ、、、、と、ここまでが9月6日の時点でした。

ところが、週末のあいだずっとんうんいっているのです。これが。さすがにこれはおかしい。

うーん。僕のMacbookairではちょっと能力不足なのかな?ということで、月曜日になって、ラボの共通機器のiMacで同じ事をやらせてみたら、一次抗体をかけている間にあっさり終了していました。うーむ。メモリはやはり16GBぐらい必要なんでしょうか。たぶん4GBだとだめなんでしょう。ああ、苦労していろいろ入れた&入れてもらった僕のMac Book Airは何だったのだろう、、、

とりあえず、これで、bisulfite sequenceのマップをする準備が、本格的に、整いました(なかなか終わりません、、、Riboblubに行ってくるのでしばらくおやすみ、するか、時差ぼけで寝られなくて連投するかは分かりませんが、ひとまず休憩です)。

中川

September 19, 2013

RNAフロンティアミーティング2013 参加レポート

はじめまして。神戸大 影山研 M1の中村と申します。
先日、静岡にて開催されたRNAフロンティアミーティング2013に参加してきました。
参加しての感想を、ミーティングレポートとして報告させて頂きます。

今回のミーティングでの発表が、私にとって初めての学会口頭発表だったこともあり、参加を決めた時から発表直前まで不安感と緊張感で一杯でした...英語発表も初めてだったので、直前まで原稿やスライドの準備に苦戦し、かなり切羽詰まった状態で発表当日を迎える事となりました(;_;)

発表中は、慣れない雰囲気に圧倒され、緊張して突っ走ってしまったり、質疑応答で満足に返答できなかったりと、悔いの残る点も多々ありましたが、それも含め私にとって、非常に意義深い経験になったと思っています。

発表をきっかけに、他大学の先生方や学生さんなど多くの方に話しかけて貰え、質問や貴重なアドバイスを頂けたおかげで、普段とはまた違った視点が得られ、視野も少し広がったように感じています。また最終日には、光栄なことにベストプレゼンテーション賞を頂くことができ、嬉しさと同時に、非常に恐縮な気持ちで一杯です... まだまだ未熟ですが、今回の経験を糧に少しずつでも成長していけたらと思います。

私自身の発表は、ミーティング初日の第一セッションで終わったため、残りのセッションは、緊張感から解放され、落ち着いた気持ちで臨む事が出来ました。
どのセッションも、興味深い発表ばかりで、連日本当に多くの刺激を受けました。発表テーマも多岐に渡っていて、普段なかなか聞く事の無い分野の発表も数多くあり、日々新鮮な学びの連続でした。

また、発表のみならず、温泉や自由時間の観光、飲み会、BBQ、花火etc...と、レクリエーションも盛りだくさんで、大満足の3日間でした(^^)

同じRNAを対象にしているとはいえ、研究内容もバックグラウンドも多種多様な皆さんと、3日間共に過ごし、ざっくばらんに色々な話をすることができ、本当に良かったと思っています。

楽しかったのはもちろんのこと、目指している方向も、考えていることも、様々な皆さんとの出会いを通じて、日々の研究室生活ではなかなか得られない多くの刺激を受けることができました。
環境は違えど、自分の芯をしっかりと持ちつつ、様々な物事に積極的に挑戦する、同世代の大学院生や学部生の姿を目にして、自分もまだまだ頑張らなければと、気持ちを鼓舞されました。

最後になりましたが、今回のミーティングを企画・運営、そして支援してくださった方々、また期間中お世話になった全ての皆さまに心よりお礼を申し上げます。
3日間を通じて得られた気付きや学びをしっかりと心に留め、今後に活かしていきたいと思います。
本当にありがとうございました。

中村


September 16, 2013

若骨にむち打ち(4)環境をととのえる

いちおうUnix風のコマンドをターミナルで打つことができるようになり、といってもこれは要はアイコンをクリックしてファイルを開いたり、webページのリンク先をクリックしてダウンロードフォルダにファイルを入れたり、というだけの作業ですが、これまでものすごくハードルが高かった作業が、ユーザーフレンドリーなインターフェースではないというだけで全然複雑な事ではないという事が良くわかってきました(すくなくとも僕がやろうとしていること(メチル化リードのマッピング)のレベルにおいては)。これはインフォ音痴のベンチ屋おじさんにとっては大きな進歩。

さて、次は解析に必要なツール、アプリケーション、パッケージ、言い方はいろいろありますが要はプログラムをインストールしてゆく段です。このあたりは師匠のY本君に実は半年ぐらい前にやってもらっていたのですが、やはり解析するべきデータがないとなかなか自分でテストデータを使って練習、、、というモティベーションが湧きませんね。練習でもいいから実験して見たら?と学生さんやポスドクに言ってもなかなか腰を上げないという気持ちが良くわかりましたです。はい。

パッケージのインストールにはHomebrewというツールが便利との事。バイオ解析系に限りませんが世に出ているプログラムというのは単体で機能する訳ではなく、いくつかのプログラムを呼び出しながら解析がすすむらしいです。ですので、何かプログラムを実行したい時は、そのプログラムが必要としている別のプログラムもあらかじめインストールしておかなければいけない。Safari上で動画を見るためにはFlashのプラグインをあらかじめインストールしておかなければいけない、というような感じでしょうか。

そこで、マニュアルをきちんと読んで必要なパッケージを入れていけば良いのでしょうが、それがなかなか面倒くさい。冗談抜きにおじさんレベルではとてもムリ、ムリ。こういう品の悪い若者言葉を使うと奥さんは目くじらを立てて怒るのですが、平安時代の人から見たら昭和のNHKアナウンサーの言葉だってとんだヤンキー兄ちゃん姉ちゃんが使っていた言葉のようなものでしょうが、とかボソっと返せば倍返しで返し文句が、、、たいがい口ゲンカというのはこういうくだらない事から始まる訳ですが、おっと寄り道はしない約束です。必要なパッケージを探してきてきちんとインストールしてくれるとても便利なツールがHomebrew、ということらしいです。

そこでまずHomebrewのインストールですが、こいつをインストールする前にまたまたやる事があります。この準備期間の長さが、実験屋に取っては万里の長城のように横たわる壁ですね。App Storeに行って、Xcodeというアプリケーション(無料)をインストールします。開発環境を入れる訳です。なんか格好いい。これは普通のMacのOfficeなどのアプリケーションのインストールと感覚的には変わりません。ただ、インストールするだけではダメで、Preference>Downloads>Componentsの設定画面に移動して、Command Line Toolsをインストールします。これもただボタンをクリックするだけ。うーむ。やはりユーザーフレンドリーなインターフェースは偉大です。キット様々。やっぱりセシウムはやめてキアゲンにしようというのが良くわかります。

これで、いよいよHomebrewをインストールする準備ができました。すっかりおなじみになったターミナルのコマンドラインで、
$ruby -e "$(curl -fsSL https://raw.github.com/mxcl/homebrew/go)"
をコピペして打ち込みます。意味は、、、わかりません。まあ、このあたりは赤子が言葉を覚えるように、ただただまねして、ひたすら打っていけば、いつかは分かるに違いない。Homebrew install Macぐらいでググれば最新情報に行き着くので、うまく行かない時はきっとそこに素晴らしい解決策が書いてあります。そう、Googleは既に分かっている事に関しては何でも教えてくれる心強い味方です。Googleさえそばにあれば最強。Ponanzaを手にしたサトシンのようなものです。おっとまた横道に、、、

これでいつのまにかHomebrewがインストールされましたので、正常にインストールされたかの確認も込めて以下のコマンドを入れます。
$brew doctor(コンピュータの診断)
$brew update(アップデートがあれば勝手にインストールしてくれる)
$brew -v(これでバージョンが確認できる)
次々と流れるコマンドラインの画面。気分はすっかりベンチ屋からバイオインフォ屋です。なんか格好いい!

あとはツールをどんどん入れていくと。Y本師匠に入れるように推奨されたのはとりあえず以下の5つでした。
$brew install samtools
$brew install bedtools
$brew install bowtie
$brew install tophat
$brew install cufflinks

これで一通りの解析ができますよ、と。ただ、こちらにはメチル化リードのマッピングのプログラムが入っていません。困った時はググれカスということでGoogle先生に聞くと、どうやらBismarkというのが良いらしい。そこでBismarkでググっていろいろ調べると、当然宰相ビスマルクのwikiページも出てくる訳で、、、えっとビスマルクって誰だっけ、とか見始めるとこれがなかな面白い。ついつい脇道にそれていつの間にかYoutubeを見ている、、、いかんいかん。これだからコンピュータは魔性なのです。コンピュータに向かってる暇あったら実験せい!!!と怒鳴っていた方々の気持ち、いたいほど分かります。ちょっとは後ろ暗い事があるからですよね??僕はもう、後ろ暗い思いでいっぱいです。あー、なんでこうすぐ横道にそれてしまうのだろう。ただ、自宅でこういった作業が出来るというのは一つの救いではあります。インターネット偉大なり。

ともあれ、Bismarkのインストール。
本家ホームページがこちら
http://www.bioinformatics.babraham.ac.uk/projects/bismark/
実際のインストールの手順は次世代シークエンスデータ解析情報共有フォーラムのWikiが便利でした。
http://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=Bismark
ターミナルのコマンドラインに打ち込んでいきます。
$wget http://www.bioinformatics.bbsrc.ac.uk/projects/bismark/bismark_v0.5.4.tar.gz
$tar xvzf bismark_v0.5.4.tar.gz
これでBismarkのインストール完了。さて、次回はいよいよシーケンスデータのマッピングです。

中川

September 15, 2013

若骨にむちうち(3)コマンドラインの恐怖

それではここから、おじさんでも出来るMacを使った次世代シークエンサー解析の初歩の初歩のメモです。Molecular Cloningで言えばミニプレップ。次世代の本格的なデータ解析に達するにはまだまだ道のり長しですが、千里の道も一歩から。

次世代シークエンサーを解析するためには、まずリードをゲノムにマップし、そのあと例えばクロマチン免疫沈降であればピークを探して統計的に解析したり、RNAseqであれば遺伝子ごとに(あるいはエクソンやイントロンごとに)リードの数を解析したりするわけですが、こういった一連の作業をするためのプログラムはフリーで配布されています。ですので、原理的には、それぞれのプログラムをダウンロードしてきて、自分のコンピュータにインストールして、データをプログラムに「食わせ」れば、少なくともプログムラムが存在するものに関して言えば、ありとあらゆる解析は自前でできる、という事になります。ところが、おじさんにはまず最初の大きな壁があります。それが、

コマンドライン と Unix (Linux)

です。MacやウインドウズのOSの登場は体感的なユーザーインターフェースでコンピュータを圧倒的に身近にしてくれましたが、次世代シークエンサー解析ツールの多くは、まだまだ普段使っているようなアプリケーションのように、適当にプルダウンメニューを表示させたりアイコンをクリックしていれば何となく使える、というようには出来ていません。そもそもアルゴリズムなどのプログラム本体自体日々改良されているので、そんなところまで構っていられませんよ、ということなのでしょう。となると、命令は全て、コマンドラインで入れる事になります。Macならばターミナルのアプリケーションを立ち上げて、そこからいろいろ命令文を入れていく訳ですが、、、

学生時代、情報科学実習というのがあったのですが、うちの奥さんなどは、そもそもコンピュータの起動の仕方が分からなくて(起動ボタンを押すという事も知らなければボタンが何処にあるかも知らない)、いきなり泣きそうになって、早々に挫折してしまったようです。文系人間恐るべし。いや、文系理系等という画一的な区分を持ち出すまでもなく、誰だって知らなければ、分からないのは当然です。多くの実験屋は、バイオインフォの解析は難しいですよねー、とか口にしていますが、解析が難しいとかいう以前の、スイッチを押すところで躓いている。僕自身、そこで躓いている事をいうのはあまりにも恥ずかしいので、うちにはバイオインフォが出来る人がいないから、、、とか、データはとれても解析できる人がいないから、、、と、お茶を濁していたのが、本当のところです。

まずは目的地のフォルダ(ディレクトリ)を開くところから。ここからして大変です。とりあえず、
$ls
$cd
という二つのコマンドを使って、普段フォルダをクリックして中身を表示させているのと同じ事が出来る、ということを理解するのに一苦労。でも、ターミナルを立ち上げて、コマンドラインで、適当にコンピュータに入っているファイルのリストを表示しているだけで、なんか仕事をしている気分になってきます。少なくとも、うちの奥さんなどには効果覿面です。見た事もない文字だらけの画面が出ているというだけで、このごろはなかなか見せてくれない尊敬のまなざしを向けてくれます。コマンドライン、偉大なり。明日の夕飯のおかずは一品増える事でしょう。

あと、いちいちファイルの名前やディレクトリを入力するのが面倒くさいなあと思っていたのですが、cdの後で何文字か入力してTabキーを押すと、おおっ!!!自動入力される!!うん。この機能を始めて使った時の感動は、そうですね、solution IIIを入れるとネバネバだった液がさらさらになってタンパク質やらSDSの沈殿が出てくるのを見た時の感動に近いものがあります。

一つ上の階層のフォルダに移るのも結構難儀していて、最初はホームディレクトリまで戻って、そこからcd+一文字押してはタブ、cd+一文字押してはタブで、戻っていたのですが、なんとこれがcd ..で戻れるではないか!これもGoogleでその記事を見つけた時の喜びは、そう、100本ミニプレップを手でやっていたのが、この世の中にはミニプレップマシーンというものが存在する事を知った時の喜びに、まさに近いものがあります。

ともあれ、必要なツールであるとかプログラムは、とりあえず cd usr/localのディレクトリに入れていくということらしい。ファイルのダウンロードに関しては、wgetというコマンドが便利、ということらしく、wgetのあとにダウンロードしたいファイルのURLを入れれば良い、って書いてあるからそうすると、以前書きました通り、
-bash: wget: command not found
という非常なエラーメッセージが帰ってきます。どうやら、Macにはこのコマンドは入っていないという事みたいです(僕がいつのまにか消した?)。とまれ、気を取り直して、まずはファイルをダウンロードするためのwgetツールのインストールです。ググるといろいろな情報が出てきますが、とりあえずSafariのURLに
ftp://ftp.gnu.org/pub/gnu/wget/
と入力するとwgetのいろいろなバージョンの圧縮ファイルが入ったフォルダが出てくるので、最新バージョンをデスクトップにコピー。それをコマンドラインでusr/localまで移す、、、のは面倒くさそうなので、Macのファインダーの移動メニューから「フォルダーに移動」を選び(もしくはshift+command+G)、/usrと入力すると、隠しフォルダの/usr/以下のファイルを見る事が出来るので、localフォルダ(ディレクトリ)にドラッグアンドドロップ。こういうやり方は邪道だと師匠のY本君は言いますが、、、いいんです。おじさんだから。ファイルの移動とか複製、削除などは、やはりMac OSのファインダー上でやるのが便利ですね。

全部Max OSからやれば良いのかもしれませんが、明日のおかずを一品増やすためにまたターミナルに戻って、コマンドラインを入力していきます。

$cd /usr/local(圧縮ファイルを入れたディレクトリに移動)
$tar zxvf wget-X.X.X.tar.gz(こうすると圧縮ファイルが解凍されるらしい。xzvfって何?ま、知らなくてもいいか。)
$cd wget wget-X.X.X
$./configure
$make
$make install

これでwgetが使えるようになりました。いつまでたっても次世代シークエンサーの解析にたどり着きそうにもありませんが、寄り道をし過ぎなのですね。はい。次回からは雑談をもう少し減らしていきます。。。

中川

September 13, 2013

若骨にむち打ち(2)実験屋も最低限の事はしないと、、、

やるやる詐欺を自らカミングアウトして、とっくの昔に帰ってきていた次世代シークエンサーのデータをなんとかする宣言をしてみたのは良いのですが、なかなかこれが手強い。学生さんやポスドクに、あの実験どうなった?これやった?それ試してみないといかんのじゃないの?などとプレッシャー(?)をかけていたのがそのままそっくりブーメランで自分に帰ってきた気分です。よっしゃ今週中にはなんとかするぞと気合いを入れまくったのは良いものの、水曜日の晩になってまだ何も出来ていないという現実を目の前に、じっとりと額に脂汗。ああ、ひんやりとする夜風に吹かれて秋の虫の声が聞こえてくるこんなすずやかな晩に、秋の夜長の新潮文庫が似合いそうなこの晩に、なぜ-bash: XXXX: command not foundとかいう、おそらくものすごく基本的なミスと、格闘せねばならんのだ!おそらく、若い世代の方がちょっと上の世代の方にぎゃふんと言わせてやろうと思ったら、まずは新しい技術を若い力を持って吸収してしまうのが手っ取り早い。なんせ上の世代は老骨、せいぜいが若骨ですから。

このような状況は、かつてもあったのではないかと。僕自身は経験していませんが、分子生物学が世に出てきた時は、おそらく似たような雰囲気であったのではないかと、想像します。発生生物学を研究しているラボでなんで大腸菌を飼っているの?というのは、いまはハァ?というような問いですが、かつてはそれが実際に不思議な問いで、岡田節人先生の普及の名著「細胞の社会」でも、そのへんが触れられていたと思います。分子生物学という「ツール」の出現の前後を例え、僕の指導教官であったT市先生(まったく伏せ字にする意味なし)は、クローニング以前の時代をBCと読んでおられましたが(Before Cloning)、仕事セミナーでも、ADの時代の技術的な細かい事に関しては「僕、良くわからないから、、、」と、基本、別のスタッフの方々や先輩の院生任せ。細胞の顔を見た時や、ウエスタンのフィルムを見た時の斬鉄剣!は、分子生物学的技術のディスカッションでは、ついぞお目にかからずじまいでした。

ある意味、それが新しいテクノロジーとの正しいつきあい方なのかなという気もします。若い世代の方が適応力は遥かに高いですし、新しいものに対する吸収力も大きい。今更自分がしゃしゃり出てあれこれかき回すよりは、若い世代に全面的に任せる事で、学生を「育て」る事が出来る、という側面もあったのかもしれません。ただ、細かい技術的なところはともかく、分子生物学のツールの使い方、可能性、限界、に関しては、T先生は驚くほど鋭い直感で捉えられていたような気がします。うーむ。なんでだろう。

他人の才能をうらやんでも仕方がないので、僕自身が思うのは、これから間違いなく次世代シークセンサー、K岡君の言葉を借りれば今世代シークエンサーのデータを使う局面は増えてくるでしょうし、どんどんテクノロジー的には「キット化」されて行くようになると思います。つまり、ワンクリックで、自分の欲しいデータが出てくるようなプラットフォームが作られると。そのようなプラットフォームの可能性や限界を理解するというのはまず一義的に大事なのですが、そもそもそれ以前に、僕ら口癖のように言っていたではないですか。「キットに頼るな!!」「ミニプレップぐらい自分でしろ!!」「キアゲン使うな!セシウムだろセシウム!!」

というわけで、胸に手を当てて考えて、ものすごく手の込んだquantitative PCRとsubtraction PCRを組み合わせたsingle cell PCRやdifferential display、、、まではできなくても、ミニプレップぐらいは、やはりしてみようと。才能に恵まれた人はその手の事をやらなくても技術の限界や可能性は理解できるのかもしれないけれども、凡人が出来る事は、とにかくひたすらミニプレップ。そこから学ぶ事も大きいにちがいない。solution I, II, IIIぐらいは自分で作ってみようよと。

なんだか時間稼ぎみたいな文章になってしまいましたが、一応、bisulfite RNAseqのリードがマップできましたよ、という、報告です。エヘン。初歩の初歩ですが、こういう場でプレッシャーをかけなければ、一生何もせずに終わったに違いない。ポスドクや共同研究者任せで。別に自分でプログラムを作った訳でもないですし、ちょっとググれば誰でも出来る事だと思うのですが、というか、多分若い人に聞いたらググレカス!!とかいわれそうなことを聞きまくってなんとかここまでたどり着いたのですが、このようなミニプレップは、やはり現場にいる人間は一度は「実習」でやってみるべきなのかな、と思っています。若い人がどれだけ苦労しているのかというのもちょっぴり分かりますし、それは基本の基本でしょう、というところも分かるはずですし。


で、若骨がどういう下らんところではまっていたか。次回はその恥さらしを。
打倒K岡君!!(果てしなくー♪、冗談、冗談)。

September 6, 2013

若骨にむち打ち(1)次世代シークエンサ解析の初歩の初歩

夏の終わりのフロンティアミーティングから、心地よい疲れと共に帰ってきました。三島さん、長尾さん、鈴木研、泊研のスタッフの皆様、素晴らしいミーティングをありがとうございました!

いろいろ楽しいエピソードはあったのですが、これはあまりにもいろいろ面白いので、せっかくですからRNA学会の会報の方にいろいろ書いていただこうかなと思っています。編集幹事の特権。エヘン。

というわけでとっておきの原稿はもうしばらくということで、僕の方から一言二言。

かつて僕も世話人の方をさせていただいた事もあるのですが、その時に強く思ったのは、ミーティングというのは参加者が全てだなという事です。良い話をする人が集まれば、それは必然的に良いミーティングになります。今回は、個人的には、文字化けさんの別名を持つ(??)アステカさんのツテもあるのでしょうか、synthetic biology系、修飾系の話がいつになく多かったのですが、それがとても新鮮でした。個々のトークのクオリティーはもちろんのこと、多様性という点でもなかなか見るべきものが多かったような気がします。

もう一つ思ったのは、やはりこの歳になっても学ぶ事が多いという事です。40代半ばというのは下手をすると若手と呼ばれる事もありますから(実際和光理研の旧基幹研の生物系PIでは僕が一番若かった、、、)、教えてもらうのは当たり前ではあるのですが、特別講演の輝さん、最年長の影山さんから学ぶのはともかくとして、とにかく貪欲に吸収しよう。何か教えてもらおう。そういう目をしている学生さん達を何人も目にして(そうでない人もいましたが!?)、これはやはり人間向上心をなくしたら終わりだな、とつくづく思った次第です。

というわけで、老骨ならぬ若骨(?)にむち打ち、新しい事に挑戦しようと。いうことで、重い腰を上げて、頑張ってRNAseqを使ったメチル化解析に取り組む事にしました。詳細はおいおい書いていきますが、要は今、fastqのファイルをもらって、途方に暮れている状態です。ちょっとずついろいろ解析しようとしているのですが、なかなか口ばっかりで具体的にすすまない。ここで公開してしまえば、どれだけさぼっているかも良くわかるので、いっその事リアルタイムで何をやっているか書いてしまえば、すこしは尻に火がついて真面目にやりはじめるかな、と思った次第です。学生やポスドクの頃はボスがやんわりとプレッシャーをかけてくれましたが、最近はそういうプレッシャをかけられる事はない、、、ん、いや、実験以外の無言のプレッシャーだとそれはいっぱいあるような気も(キミソレデハタライテルキニナッテルノ)、、、それはともかく、

ミッション「bisulfite RNAseqのデータを解析せよ」

です。
とりあえず、何でも知ってるはずのGoogle先生に尋ねると、Bismarkというものを使えば良いらしいです。しかしー、一番親切そうなこのページ
http://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=Bismark
を見ても、良くわからん。そもそも、テストデータを解析するためのヒトゲノムすら入っていない。というわけで、まずはそこから。

えっとターミナルを立ち上げて、たしかMac OSはUnixコマンドがそのまま使えるはずだからっ、と。Google先生曰く、
「外部接続可能なLinuxなどがある方は、直接wget等を実行しても良いと思います。」
ということで、そこにあった、
$wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz
とターミナルに打ち込んでみたのですが、非常にも、

-bash: wget: command not found

なんだそれ、、、

というわけで、かなり道のりは長そうです(分かる人には分かる。僕がどれだけくだらんところで詰まっているかを、、、)。というのが、9月2日。現在では、一応それから少しすすんで、CをTに変換したゲノムを作らせてるところです。エヘン(分かる人には分かる。僕がどれだけ詰まらん事を自慢しているかを、、、)。先ほど走らせて、いま、うんうん僕の小さなMacbookairがファンの音を鳴らしながら頑張ってくれています。

ともあれ、これから恥さらしの解析の四苦八苦、随時アップしていきます。何も書かなかったら、仕事していないという事です。ハイ。もしくは、他の仕事しているか。現実逃避でネズミをさばいたり切片を切ったりしているか。これはものすごいプレッシャーなので、すこしは仕事が進む、かな?

中川