スキップしてメイン コンテンツに移動

投稿

ラベル(sequencing)が付いた投稿を表示しています

次世代シークエンサー現場の会 第三回研究会が無事終了しました

今年度の代表を務めた「次世代シークエンサー現場の会」が無事終了しまし た。 有能なスタッフや、素晴しい講演をして頂いた演者のみなさま、会を支えてくれた50に迫るスポンサー企業、そ して参加者のみなさまのおかげで非常に盛り上がりました。最終的 に、研究者・技術者、医療従事者、企業の方など700人が一同に 介し、活発な議論をして頂けました。ありがとうございました。 これから様々な事後処理がありますが、がんばっていきましょう > スタッフ 来年は新しい運営体制で東京で実施する予定です。では来年! NGS現場の会:  http://ngs-field.org/

DNAを増幅するサーマルサイクラーを自作してみたよ

DNAをPCR法で増幅するために必要なサーマルサイクラーを自作してみました。自作と言っても、いわゆる、PCの自作と同じでパーツを組み立てていく感じです。購入から組み立ての様子を簡単に紹介します。 モチベーション ラボには様々なレクリエーションがあります。例えば、単にどこかに遊びに行ったり、スポーツ大会したり、ひたすら合宿形式でプログレスのプレゼンをするミーティングするなどがあります。それもよいのですが、せっかくなので、普段の研究時間ではトライできないが、研究に関わる hack を行う、というイベントを企画してみました。夏休みの自由研究や社会科見学的なノリです。   うちのラボでは、PCRを使ったウェットの実験技術の開発をしてきました。しかし、サーマルサイクラーのハードウェアの仕組みを体験的に理解している訳ではありません。そこで、サーマルサイクラーを作ってみました。   欧米で始まっている、自宅のガレージやキッチンでバイオロジーを行うムーブメント、バイオパンク、DIYbio を体験しておきたいというのもありますし、Arduino などオープンハードウェア、Maker のムーブメントを体験するのも目的の一つです。ハードウェア開発が思っているほどハードルが下っていることを体験できて、かつ、将来、ウェットの開発だけでなく、装置開発などもできたら、ラッキー、ぐらいの気持ちでやってみました。   購入 今回作ったのは、組み立て式で、かつ、仕様などや設計図が公開されているOpenPCRというサーマルサイクラーです。ハードウェアの仕様・設計図、制御ソフトウェアなどの情報がすべて公開されており、部品からも自作することが可能です。今回は、「設計図から部品や回路のパーツを作り、それらを組み立てる直前のもの」を購入しました。   ChaiBio https://www.chaibio.com/   OpenPCR https://www.chaibio.com/products/openpcr   なぜか http://openpcr.org/  で購入できなかったので、eBay にある ChaiBio で買いました。   OpenPCR - eBay http://www.ebay.com/itm/111096418574   本体価格は ...

Quartz-Seqで1細胞/微量RNA-Seqを始めたい方へ

はじめに 新しい高精度な1細胞RNA-Seq, Quartz-Seq論文を出してから、各方面から多く相談を受けています。 Sasagawa Y and Nikaido I, et. al .  Quartz-Seq: a highly reproducible and sensitive single-cell RNA-Seq reveals non-genetic gene expression heterogeneity . Genome Biology. 14. 2013  そこで、新しく1細胞RNA-Seqを始める方へ、僕達が理想だと考えている技術導入の手順を紹介したいと思います。また我々の方法は1細胞(6-14 pg Total RNA)だけでなく pg-ng オーダーの少量RNAからシーケンスが可能です。そのような方も以下の手順が参考になると思います。 0. 1細胞/微量RNA-Seqが本当に必要なのか検討する 1細胞/微量RNA-Seqでは、現時点でQuartz-Seqが世界最高の性能を持っている訳ですが、十分なサンプルを用意し、通常のRNA-Seqしたほうが、より精度の高いデータが得られます。なので、基本的には、サンプルをたくさん集める方法をしっかり検討すべきです。まずは、戦略面と技術面で1細胞/微量RNA-Seqが本当に必要かを検討する基準について書きます。 0.1. 戦略面での検討 あなたが抱えているプロジェクトが、1細胞/微量RNA-Seqでなければアプローチできないかどうかを問い直すことが重要です。 基本的には以下の2つの状況で、1細胞/微量RNA-Seqが役に立ちます。 a. 細胞状態が連続的に変化し、さまざまな細胞状態が、細胞集団に含まれている場合 (振動現象、ゆらぎなど) b. 細胞状態を特定するマーカーがほどんどわかっていない場合 最初から細胞状態が2状態しかないことが明らかで、しかも細胞状態を代表する遺伝子が分かっている、という状況では、FACSなどで cell sorting し、目的の細胞を採取することを考えるべきです。そして、微量RNA-Seqや通常のRNA-Seqで、しっかりと biological replication...

ラボを立ち上げます

ひさびさのブログ更新です。明日は年度の始めで忙しそうなので、今日書いておきます。 2013/03/31をもちまして理研CDBを退職しました。4/1からは埼玉県和光市にある、理研本所の情報基盤センターにて、バイオインフォマティクス研究開発ユニットという研究室をユニットリーダーとして主宰することになりました。 DNAシーケンスのデータ解析の手法、ソフトウェア、そして実験技術の開発を中心に研究を進めつつ、理研内外の実験生物学者と共同で生命科学の問題を解いていきます。また理研のバイオインフォマティクスをどのように支え、発展させていくかを考えることも求められています。みなさまのお力をお借りすることもあるかと思いますので、これからもどうぞよろしくお願い致します。 ラボの公式ウェブサイトは以下にあります。 独立行政法人 理化学研究所 情報基盤センター バイオインフォマティクス研究開発ユニット

ChIP-seq データ解析の講義をしたので資料公開するよ

JSBi共催「Rでつなぐ次世代オミックス情報統合解析研究会」で「R + Bioconductor を使った ChIP-seq データ解析の基礎」という講義を担当してきました。主に ChIP-seq 解析の流れを簡単に示し、パイプラインについて説明しました。Peak calling や mapping などの情報が比較的入手しやすいステップよりも、アノテーションや、モチーフ解析や異なる ChIP-seq データ比較などの高次解析の部分を多く取り上げています。 最初は20-30人程度のハンズオンセミナーというオファーでしたが、100人を越える参加者が集まりました。なのでハンズオンはできなかったのですが、概要を掴んでもらえるよう心がけました。ほかの演者の方の発表に関しても発見や気付きがあったので自分の研究にも役に立ちそうです。質疑や懇親会も非常に盛り上がりとても有意義な会でした。 ChIP-seq の経験者が参加者全体の1割程度と mRNA-seq にくらべるとまだまだ少ないようですが、相互作用を出力できる数少ないオミックス技術なので、日本でももっともっと普及すればよいなと思っています。 個人的には、たくさんのRで解析をされている方に会うことで、Rをプログラミング言語としてではなく、純粋に統計環境として利用している頃の気持ちを思い出しました。 講義に使用したプレゼンテーション、ソースコード、データはすべて以下のサイトに置いてあります。今後も微妙にアップデートするかもしれませんので、github をお使いのかたは、watch list に登録しておくと良いかもしれません。 講義資料: R + Bioconductor を使った ChIP-seq データ解析の基礎 (二階堂愛) なにか質問があればご連絡ください。では。 リンク:  Rでつなぐ次世代オミックス情報統合解析研究会

R + Bioconductor で遺伝子構造を描く

From Evernote: Rで遺伝子構造を描く 超並列DNAシーケンサーの登場で、遺伝子構造など、ゲノム上のイベントやオブジェクトのデータを大量に得ることができるようになってきました。データ解析にとって可視化は重要ですが、ゲノム上で起きているイベントなので、ゲノム上に配置して可視化したい場面がよくでてきます。しかし、さまざまなゲノム上のオブジェクトをゲノム座標から画像座標に変換して、絵を書くのは意外と面倒な作業です。 例えば遺伝子構造の絵を書こうとします。これは、遺伝子構造をどのように入手するか、遺伝子構造をどのように描くか、の2つの問題に分けることができます。ここでは、遺伝子構造のデータは、R + Bioconductor の biomaRt パッケージを使って、Ensembl Biomart からダウンロードすることで解決します。遺伝子構造をどのように描くかについては、GenomeGraphs パッケージを利用します。 まずはインストールします。 $ sudo R > source("http://www.bioconductor.org/biocLite.R") > biocLite("biomaRt") > biocLite("GenomeGraphs") ここでは、Ensembl biomart からヒトの SMN1 という splicing 異常によって疾患になる例が知られている遺伝子名(Gene symbol)の遺伝子構造を描きます。 まず、SMN1 という名前から、Ensembl Gene ID と染色体位置などを入手します。 library(GenomeGraphs) library(biomaRt) gene.symbol <- "SMN1" png.file <- paste(gene.symbol, ".png", sep = "") ## construct an object of Human Ensembl Biomart human ...

ゲノム可視化に関するR+Bioconductorのパッケージ

From Evernote: ゲノム可視化に関するR+Bioconductorのパッケージ 個々のツールにも可視化の機能があるが、ここではゲノムの可視化を専門とし、特定のアプリケーション(RNA-seq, ChIP-seq, microarray, CNV など) に依存せずに、汎用的に活用できるパッケージを紹介する。 GenomeGraphs Plotting genomic information from Ensembl http://www.bioconductor.org/packages/release/bioc/html/GenomeGraphs.html 既知のゲノム・遺伝子構造などを Ensembl biomart から biomaRt を使って取ってきて、いろいろなプロットできる。もちろん自分の実験データ(シーケンスや microarray など)のプロットもできる。 genoPlot http://genoplotr.r-forge.r-project.org/ 自分で作成したデータや BLAST や DB の flat file から作図できる。比較ゲノム的な可視化に強い印象。 Bioconductor じゃなく、CRAN。まあ、BioCに通すのはいろいろ大変だからね... ggbio Static visualization for genomic data Genome界の ggplot2 と言えばいいか。遺伝子構造から coverage, 染色体マップまで描ける。 http://www.bioconductor.org/packages/release/bioc/html/ggbio.html biovizBase Basic graphic utilities for visualization of genomic data ggbio のコードを理解するには知っておいたほうがいい。 http://www.bioconductor.org/packages/release/bioc/html/biovizBase.html ChromHeatMap Heat map plotting b...

DNA motif 検索に関連するBioconductor のパッケージ

From Evernote: DNA モチーフ検索に関連するR+Bioconductor のパッケージ BSgenome Infrastructure for Biostrings-based genome data packages まずこれを知ってないとどうにもならない。Biostrings = 生命科学で利用する文字列、つまり DNA 配列を操作するためパッケージ。これが提供するデータ構造、クラスは理解しておきたい。PWM やDNA配列パターン(コンセンサス配列)を検索する関数やリピート配列をマスクする関数などがあり、モチーフ検索と深く関連する。 http://www.bioconductor.org/packages/release/bioc/html/BSgenome.html rGADEM de novo motif discovery そのまんま。結構早い。MEMEよりずっと速い。 http://www.bioconductor.org/packages/release/bioc/html/rGADEM.html MotIV Motif Identification and Validation DNA配列内になる既知のモチーフ配列を検索する。STAMP algorithm ( http://www.benoslab.pitt.edu/stamp/ ) を利用。seqLogo のラッパー関数がありで sequence logo も描ける。motif distribution などの可視化に関する関数も備える。 http://www.bioconductor.org/packages/release/bioc/html/MotIV.html cosmo Supervised detection of conserved motifs in DNA sequences MEMEっぽいアルゴリズムのモチーフ発見ツール。可視化も含む。GUIもあるらしい。 http://www.bioconductor.org/packages/release/bioc/html/cosmo.html BCRANK Predicti...

MBSJ2011で次世代シーケンスの「イブニングフォーラム」やりますよ

MBSJ イブニングフォーラム「核内情報の次世代シーケンス解析 — 現在と未来 –」 日時: 12/14 (水, 2日目) 19:50 – 20:50 会場: パシフィコ横浜 会議センター4階 413(第10会場) 企画:  二階堂愛  (理研CDB)、 渡辺亮  (京大iPS研) 主催: NGS現場の会 参加方法: 申し込みは必要ありません。参加費も無料です。 参加資格: どなたでも参加できます。 http://ngs-field.org/meeting/mbsj2011_forum 趣旨: 次世代シーエンサーが、生命科学の新しい知見を引き出すツールとしての地位を確立しつつあります。しかも、これまでビックラボがビックサイエンスとして進めてきたオミックス技術が、ラボ・研究者単位で自在に使えるようになってきました。このような時代に、自分の生命現象に対する疑問を解くツールとして、実際に自分の手で利用しデータを解析している最先端の研究者のご講演を元に、次世代シーケンシングの現在と未来について議論したいと思います。 今、次世代シーケンサーを使って研究を進めている方以外にも、これから次世代シーケンシングを行いたい方、次世代シーケンサーについて現状を知りたい方の参加も歓迎します。どなたでも無料で参加できます。 会場で軽食/飲み物を提供します(数には限りがあります)。また会が終わった後に会場を出て、演者を交えた懇親会も企画しています。次世代シーケンサーについて本音で語り合うチャンスです。是非、皆様の参加をお待ちしております! プログラム: 19:50 – 20:10 「FAIRE-seq法を用いた脂肪細胞分化に関わる転写制御因子の同定」 中村正裕 (東大・医)  参考文献 20:10 – 20:30 「高次クロマチン構造解析技術:ChIPseqから3Cseqに向けて」  大川恭行 (九大・医) 20:30 – 20:50 「総合討論」 司会:  二階堂愛  (理研CDB)

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。 まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。 気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。 From Evernote: シーケンスアダプタ配列除去ツールまとめ TagDust http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash 使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq 解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple ...

ChIP-seqの統計解析のレビュー読んだよ2

今回読む論文はこれ。 3. Pepke, S., & Wold, B. (2009). Computation for ChIP-seq and RNA-seq studies. Nature method ChIP-seq について体系的に書かれているレビュー。現在出版されているレビューのなかでは一番良いと思う。 ChIP-seq の概要 ChIP-seq を成否は、 1. 十分に binding site が enrich されていること 2. enrich されたクロマチン分子を獲得できていること の2点に依存する。 mapping は specificity (unique reads only) と increasing sensitivity (multireads used) のトレードオフがある。ChIP reactions は enrichments であって purifications ではない(`・ω・´)キリッ Background と真のシグナルを分ける必要がある。哺乳類ゲノムは大きいので background の coverage が低いことに注意する。単純な tag count が多いピークに生物学的な意味があるとは限らない。バックグラウンドやコントロールとの比較する。いろんなツールやパラメータを試して変化のないピークをつかうべき。 ChIP peak の分類 sequence specific tf だと特定の位置に鋭いピークが立つ。RNA polymerase はTSSに強く鋭いピークがでるが gene body にも broad なシグナルがでる。Histone などの場合は nucleosome level の broad なピークが続く。それぞれ別なアルゴリズムやパラメータで検出しなければならない。 Peak finding の用語整理と解析の流れ まずは用語の説明。ホワイトボードにメモった手書きの図をアップしておく。read を reference genome に mapping すると1塩基ごとの tag count が計算できる。この tag count から binding site を得る問題を解く。この際に、tag count から分布に変換する処理を peak calling や peak findin...

ChIP-seqデータ解析のムービーを集めたよ

YouTube などにアップされているChIP-seq解析のムービーを集めてみました。あまりないですね。僕は以下のツールはひとつも使っていないですが、ムービーを見る限り、最近のGUIのツールはよくできている印象を受けました。NGS解析怖くない! まあ、http://outloger.com/ を使ってみたかっただけというのが本当のところですw DNASTAR- ChIP-Seq Workflow DNASTAR's ChIP-Seq software allows users to quickly and easily identify transcription factor binding sites. The software enables users to ... GenomeQuest - ChIP-Seq Workflow This video is an overview of the GenomeQuest ChIP-Seq Workflow. This solution provides state-of-the-art tools across the entire workflow ... Simple ChIP-Seq Analysis with SeqMonk This video shows the process of doing a simple analysis of a single ChIP-Seq dataset. It goes through the process of identifying and quantitating ... SeqMonk initial setup This video shows the process of setting up a new installation of SeqMonk for the first time. ... SeqMonk configuration ... Visualizing and Analysing ChIP-Seq Data with Subio Platform Importing ChIP-Seq data based on Illumina's next generation sequencing technology in...

RNA-seq から発現量が変動した遺伝子をどのように得るか

RNA-seq のデータから、統計的に有意な変動を示す遺伝子をどのように得るか。Microarray ときにも散々議論されましたが、RNA-seq でも同じく議論になっています。現在提案されている手法についてまとめてみました。 まだ全部には目を通せてません。すべて読んだ後に解説を書くかもしれませんが、網羅している自信がないので、先にリンクを列挙しておきます。主に論文とツールのソースコード、マニュアルなどです。ほかに情報をお持ちの方は教えてくださいな。 1. cufflinks と cuffdiff http://cufflinks.cbcb.umd.edu/howitworks.html の後半に cuffdiff の説明がある。 FPKM Trapnell C, Williams BA, Pertea G, Mortazavi AM, Kwan G, van Baren MJ, Salzberg SL, Wold B, Pachter L. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature Biotechnology doi:10.1038/nbt.1621 http://dx.doi.org/10.1038/nbt.1621 Jensen–Shannon divergence http://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence 以下の3つも知っておいたほうが理解しやすい良い。 RPKM Ali Mortazavi, Brian A Williams, Kenneth McCue, Lorian Schaeffer and Barbara Wold Mapping and quantifying mammalian transcriptomes by RNA-Seq Nature Methods, volume 5, 621 - 628 (2008) http://www.nature.com/nmeth/journal/v5/n7/abs/nmeth.1226....

ゲノム座標を異なるゲノムバージョンの間で変換するよ

マイクロアレイのアノテーションが古い、などの理由でゲノムのバージョンが古い座標を使ったファイルを使わなければならないときってありますよね? でも新しいゲノムのバージョンで解析しているほかのデータと一緒に見たい!! そんなときに座標を変換する方法を調べてみました。 (注: もちろん元のDNA配列が得られるなら自分でマップしたほうがいいですよ) ここでは、マウスゲノムの mm8 から mm9 へ座標変換します。Linux が前提ですが、ほかでもかわりないです。変換されるファイルの形式は bed が基本ですが、オプションでほかのファイルにも対応できそうです。bed ファイルでも browse 行や track 行があるとエラーになるので除いておきましょう。 まず変換テーブルをダウンロードします。 curl -O http://hgdownload.cse.ucsc.edu/goldenpath/mm8/liftOver/mm8ToMm9.over.chain.gz gzip -d mm8ToMm9.over.chain.gz ほかのゲノム間を比較したい場合は、 ">golden path のダウンロードサイト の下に liftOver というディレクトリがあって、そこに変換テーブル (*.chain) があります。 変換プログラムをダウンロードしてインストールします。 curl -O http://hgwdev.cse.ucsc.edu/~kent/exe/linux/liftOver.gz chmod +x ./liftOver sudo cp ./liftOver /usr/local/bin/ では変換してみましょう。mm8.bed が変換したい mm8 なゲノム座標のファイルで、mm9 な座標に変換後 mm9.bed に保存されます。unmapped.txt は座標変換が失敗したエントリが保存されます。 liftOver mm8.bed mm8ToMm9.over.chain mm9.bed unmapped.txt とても簡単、とても高速!!! ありがとう Dr. Jim Kent! あと liftover を 教えてくれた @32nm ありがとう 。 Liftover Web版 もありますよ。