April 1, 2013

Y本氏からのメール #3

岩川さんのものすごく面白い話題のあとに、ゆるい記事ですみません。。

H川担当のこちらの記事は、
あくまでも「ちょっとやってみたい人」向けなので(解析というか作業レベル)
軽〜く読んでいただければ幸いです。
作業のあとの解析が真に頭を使うところのようで
はまったひと(Y本さん)は実に楽しそうです。
まあでも、解析まで行き着くにはまず作業が必要ということで、、、

SRAファイルをFASTQファイルに変換する

何とかBEDファイルが見られるようになったものの、
見てみたいデータがBED形式で登録されていないという状況に直面しました。
(#2投稿参照)
BEDファイルはいずこ

困りました、とY本さんにメールを送った次の日に返ってきたのが以下のメールです。

**********************************************************************************
差出人: Y
日時: 2012年8月12日 10:09:45JST

Y田研でCPUが余っていたのでちょっと変換してみました。

もし良かったらどうぞ。
sandy-bridgeのcore-i5(4core)で30minといったところです。

madogiwa-no-iMac:SRR398208 xxxxxxxxxxxx$ fastq-dump -A SRR398208

madogiwa-no-iMac:SRR398208 xxxxxxxxxxxx$ bowtie -p 4 -v 2 --sam --chunkmbs 1024 

--best hg19 /Users/xxxxxxxxxxxx/SRR398208/SRR398208.fastq /Users/xxxxxxxxxx/
SRR398208/SRR398208.sam
**********************************************************************************


SRAファイル (GEOに登録されているデータ)をFASTQファイルに変換して、
Bowtieでマッピングしてくれたようです。
おおー。たった一日の間になにがあったのでしょうか。

ちなみに私は
「$」この文字が何なのかもさっぱり分かりませんでした。ドル?

ありがたくファイル頂戴します!と受け取ったのですが、
自分でもやってみたいな、と思ったのでMacのターミナルを触ってみることにしました。

アプリケーション>ユーティリティ>黒い画面です

ターミナルを使い出すにあたって
まずXcode(コンパイラとか色々入っているもの)をダウンロードしました。
ダウンロードの仕方はこちらが詳しいです。

次に、SRA tool kit をダウンロードします。
ホームディレクトリにこういうツールをまとめておくフォルダを作って
そこに置いておくと便利だそうなので、そうしてみました。


こんな感じのフォルダを作ってSRA tool kitを入れてみました

SRA tool kitの中にはこんなものが入っています。

binのなかにプログラムが入っています。
面倒なので説明は省きますが、”PATHを通す”という作業をすると使いやすくなります。
通さなくても使えます。使い方は以下です。


1.プログラムのあるディレクトリ(SRA tool kitフォルダ)に移動する

ターミナルにcdと打って、スペースを入れて
移動先のフォルダをターミナルにドラッグ&ドロップするのが簡単かと思います。


2.変換したいSRAファイルをSRA tool kitのフォルダに入れる

3.fastq-dump (SRAファイルをFASTQに変換する)を実行

ターミナルに ./bin/fastq-dumpと打ってスペース入力後、
SRAファイルをドラッグ&ドロップします。

「.」は、今いるディレクトリ(=SRA tool kitフォルダ内)を示します。
したがって、「./bin/fastq-dump」というのは
「SRA tool kitフォルダ内のbinフォルダ内のfastq-dumpを実行」ということになります。
PATHを通しておくと、1と2の作業が要らなくなるんではないかと思います。

SRR107032.sraというのがSRAファイルです

4.実行するとfastqファイルが出来ます。

できました

おそまつさまでした。


長谷川(理研・中川研)

No comments:

Post a Comment