スキップしてメイン コンテンツに移動

Quartz-Seqで1細胞/微量RNA-Seqを始めたい方へ

はじめに

新しい高精度な1細胞RNA-Seq, Quartz-Seq論文を出してから、各方面から多く相談を受けています。


そこで、新しく1細胞RNA-Seqを始める方へ、僕達が理想だと考えている技術導入の手順を紹介したいと思います。また我々の方法は1細胞(6-14 pg Total RNA)だけでなく pg-ng オーダーの少量RNAからシーケンスが可能です。そのような方も以下の手順が参考になると思います。

0. 1細胞/微量RNA-Seqが本当に必要なのか検討する

1細胞/微量RNA-Seqでは、現時点でQuartz-Seqが世界最高の性能を持っている訳ですが、十分なサンプルを用意し、通常のRNA-Seqしたほうが、より精度の高いデータが得られます。なので、基本的には、サンプルをたくさん集める方法をしっかり検討すべきです。まずは、戦略面と技術面で1細胞/微量RNA-Seqが本当に必要かを検討する基準について書きます。

0.1. 戦略面での検討

あなたが抱えているプロジェクトが、1細胞/微量RNA-Seqでなければアプローチできないかどうかを問い直すことが重要です。

基本的には以下の2つの状況で、1細胞/微量RNA-Seqが役に立ちます。

a. 細胞状態が連続的に変化し、さまざまな細胞状態が、細胞集団に含まれている場合 (振動現象、ゆらぎなど)
b. 細胞状態を特定するマーカーがほどんどわかっていない場合

最初から細胞状態が2状態しかないことが明らかで、しかも細胞状態を代表する遺伝子が分かっている、という状況では、FACSなどで cell sorting し、目的の細胞を採取することを考えるべきです。そして、微量RNA-Seqや通常のRNA-Seqで、しっかりと biological replication を取る方が良いでしょう。微量になると、テクニカルなノイズが増えるために、生物学的な差を知るためには、n をしっかり確保するのが重要です。もしかしたらRNA-Seqでなく、qPCRでも十分かもしれません。

0.2. 技術面での検討

1-10 ng 程度の Total RNA でも illumina 社 TruSeq RNA prep kit で十分シーケンス可能です。その場合は、ロスの少ないRNA抽出法を用いるのがポイントになります。そのためにお使いの細胞がどのぐらいRNAを持っているか定量することが重要です。まず細胞数をカウントしRNAを抽出・定量します。その後、1細胞あたりのRNA量を計算します。一般的には、2-20 pg あたりになります。

1細胞ではなく微量RNA-Seqのプロトコールはこちら。ライブラリ作製にもコツがあります。短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

まとめ
- 1細胞RNA-Seqである必然性を検討する
- 確保できるRNA量と biological replication の数を検討する
- 1細胞でなくてよいなら、ロスの少ないRNA精製法と通常のRNA-Seq法を試す
- 1細胞あたりのTotal RNA量を定量する

1. Quartz-Seqの導入

1.1. Quartz-Seq を導入

これまでの1細胞RNA-Seq法と異なり、Quartz-Seqは、簡便でロバストな方法なので、プロトコールを読みながら、自分でやってみると良いでしょう。笹川さんが丁寧にプロトコールを書いてくれました。
まず1細胞相当RNAを用意しましょう。細胞数をカウントしたのち、RNAを抽出、1細胞相当まで希釈します。これを1細胞と見立てて、Quartz-Seqの導入に利用します。このときは本番で利用する細胞ではなく、大量にRNAが手に入る細胞を利用することをお勧めします。またその細胞の通常のRNA-Seqを先にしておくことを強く推奨します。

重要な注意点はプロトコールに書いてありますので、そちらを見てください。温度や時間などひとつひとつに意味があります。なのでまずはそれらを一切変更せずに行うことが重要です。意味については論文のサプリメントにしっかり書いてあります。試薬はなるべくフレッシュなものを利用してください。業者によってはメーカーから購入後、業者に在庫として抱えている場合があります。このような場合は在庫するまでの間に試薬の状態が変化している可能性も考えられます。メーカーが届いたらその足でラボに届けてもらうようにお願いしましょう。

こちらも、短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

1.2. 導入できたかどうかを判断するには

Quartz によるWTA (Whole transcript amplification) が終了した時点で、cDNAを電気泳動し、そのバンドパターンを見てください。正しいバンドパターンは論文に出ています。200bp 程度の副産物出ていないことも確認してください。

次にcDNA収量を確認し、期待できるだけ増えているかを確認します。それらを数回繰り返し、そのばらつきをCV (変動係数)で定量化し、安定したことを確認してください。

その後、その細胞で発現している遺伝子を10-30遺伝子程度選び、得られた cDNA に対して、qPCRをしてください。この時、発現量が高い遺伝子、中程度のもの、低いものをまんべんなく選ぶのがポイントです。生物学的現象を追っている人は、その現象に関わる遺伝子の qPCR をする人が多いですが、技術的な評価には、バイアスのない遺伝子の選択が重要になります。qPCRデータを scatter plot にし、線形回帰分析でR^2(決定係数), R(相関係数) をそれぞれ計算します。また遺伝子ごとに CV を計算し、x軸にその遺伝子の発現量、y軸にCVをプロットし、ばらつきがどの発現量域で表われるかを観察します。

ちなみに、我々は、8回の独立した増幅をした後、それらに対して30遺伝子程度の qPCR を行い、性能評価を行いました。もう少し遺伝子数は減らしても大丈夫だと思います。あるいは MiSeq でシーケンスしたほうが早いかもしれません。最終的には、シーケンスを行い、複数回の増幅のピアソン相関係数を確認し、少なくとも0.8、できれば0.9を越えることを確認しましょう。

最終的にはシーケンスして確認します。独立して増幅したサンプルをRNA-Seqします。また通常のRNA-Seqもします。これらを qPCRと同様の方法で比較します。検出された遺伝子数を確認します。通常のRNA-Seqや独立した増幅サンプルで、8割以上の遺伝子が検出されていることを確認してください。

まとめ
- 1細胞相当のTotal RNAを用意する
- cDNAの泳動像と収量を確認する
- qPCRとシーケンスで定量し, 相関係数とCV、検出遺伝子数で性能・安定性の評価をする

2. 細胞の採取

1細胞や微量サンプルを採取する方法を確立します。ここは我々の専門ではないので、各々が持つ技術に応じて、細胞を採取する系を立ち上げてください。我々の経験としては、ガラスピペットを利用してマニュアルで採取しても Qaurtz-Seqが上手くいくことを確かめています。

ポイントは以下の2点です。

a. 細胞と一緒に持ち込んでしまう液量を減らす、あるいは一定にすること
b. 細胞が破砕・融解されていること

a に関しては、1細胞sorting が理想です。bに関しては、顕微鏡で細胞が融けていることをしっかり確認しプロトコールを確立してください。細胞がしっかり解けなければ、RNAが細胞の外に出てこないせいか、うまく反応が進まないことがあります。ここを越えれば、あとはプロトコールにしたがって、Quartz-Seq を進めるのみです。

まとめ
- 1細胞を採取し、細胞を融解する条件を作っておくこと

3. 検証実験の立ち上げ

RNA-Seq や Microarray をした後、必ず qPCR, ISH, RNA FISH などで検証すると思います。1細胞RNA-Seqも同様に、なんらかの検証をする必要があります。Quartz-SeqはRNAを増幅する技術ですので、理想的には増幅せずに、まったくの別法で確認すべきです。しかし、既存の1細胞qPCRは、増幅が必要な方法ばかりです。そこで、我々の論文では、非PCRの1細胞qPCRも提案しています。詳しくは論文を読んでください。また、ISHやRNA FISH を立ち上げておくのもよいでしょう。このような系を持っておくと、データを論文化までのスピードが格段に上がると思います。特にシーケンス実験は解析も含めると時間がかかるので、その間に、必ず立ち上げておきましょう。

まとめ
- Qaurtz-Seqの結果を評価する実験系を持ちましょう

4. シーケンス実験計画

Quartz-Seqは illumina 社HiSeqを前提としていますが、cDNAができたらDNA用のシーケンスライブラリキッドと併せて、どのようなシーケンサーでも読めると思います。

シーケンスリード数はQuartz-Seqのダイナミックレンジに影響します。最低でも2000万リード程度(マッピング後)は欲しいところです。論文では、3000-6000万リードぐらいでデータを出しています。HiSeq 2500, 4-8 sample/lane を目安にすると良いでしょう。リード数とダイナミックレンジの関係は論文のサプリメントを確認してください。

ライブラリ作製は Quartz-Seq 用の LIMprep 法を利用してください。

1細胞RNA-Seqは数細胞だけ行なってもその後の解析は不可能です。細胞集団にどのぐらいの比率で異質性があるかを想定して、シーケンスする細胞数を決定しましょう。例えば10個に1つの異質性をみるのに、10細胞以下で実験しても意味がない、ということです。まずは20細胞ぐらいを目標にしてみると良いと思います。そのぐらいあれば一般的な多変量解析の手法が意味を持って使えると思います。

もし、細胞周期の影響を除きたい場合は、FACSなどで細胞周期が同じ細胞のみ採取すると良いでしょう。

最後に費用ですが、シーケンス費用を除いた、Quartz WTAについては 500円/sample です。

まとめ
- 4-8 cells/lane, 2000万リード以上
- 20細胞以上
- Quartz WTAは1反応が500円

5. データ解析

1細胞だからと言って特別な解析はないですが、Quartz-Seqなど1細胞RNA-Seqのデータをみるときの注意を書いておきます。

まず、プライマー配列が標的のmRNAに対して極端に多いので、どうしてもシーケンスデータに含まれます。なので、FASTQからプライマ配列を trimming しましょう。Quartz-Seq の場合は、8%程度コンタミします。それ以上の場合は、suppression PCRやプライマー除去のステップがうまくいっていない可能性があります。

また通常のRNA-Seqの場合は、数十から数万細胞に1コピーのRNAがあっても定量されます。なので、そのような遺伝子のついても数値化する意味があるかもしれません。しかし1細胞RNA-Seqの場合は、1細胞に1コピー以下、ということを考える意味がないため、1コピー以下に相当するデータをプロットしたり、解析に利用する必要はあまりありません。

まとめ
- プライマー配列をトリミングする
- 1コピー以下を考える必要はない

最後に

我々は、新しいシーケンス技術を作ることに喜びを覚えており、Quartz-Seqが広く使われることを望んでいます。今後も以下のサイトで情報公開を行なっていきます。我々の方法があなたの研究の役に立てば幸いです。がんばってください!

コメント

このブログの人気の投稿

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。 まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。 気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。 From Evernote: シーケンスアダプタ配列除去ツールまとめ TagDust http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash 使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq 解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple

DNAを増幅するサーマルサイクラーを自作してみたよ

DNAをPCR法で増幅するために必要なサーマルサイクラーを自作してみました。自作と言っても、いわゆる、PCの自作と同じでパーツを組み立てていく感じです。購入から組み立ての様子を簡単に紹介します。 モチベーション ラボには様々なレクリエーションがあります。例えば、単にどこかに遊びに行ったり、スポーツ大会したり、ひたすら合宿形式でプログレスのプレゼンをするミーティングするなどがあります。それもよいのですが、せっかくなので、普段の研究時間ではトライできないが、研究に関わる hack を行う、というイベントを企画してみました。夏休みの自由研究や社会科見学的なノリです。   うちのラボでは、PCRを使ったウェットの実験技術の開発をしてきました。しかし、サーマルサイクラーのハードウェアの仕組みを体験的に理解している訳ではありません。そこで、サーマルサイクラーを作ってみました。   欧米で始まっている、自宅のガレージやキッチンでバイオロジーを行うムーブメント、バイオパンク、DIYbio を体験しておきたいというのもありますし、Arduino などオープンハードウェア、Maker のムーブメントを体験するのも目的の一つです。ハードウェア開発が思っているほどハードルが下っていることを体験できて、かつ、将来、ウェットの開発だけでなく、装置開発などもできたら、ラッキー、ぐらいの気持ちでやってみました。   購入 今回作ったのは、組み立て式で、かつ、仕様などや設計図が公開されているOpenPCRというサーマルサイクラーです。ハードウェアの仕様・設計図、制御ソフトウェアなどの情報がすべて公開されており、部品からも自作することが可能です。今回は、「設計図から部品や回路のパーツを作り、それらを組み立てる直前のもの」を購入しました。   ChaiBio https://www.chaibio.com/   OpenPCR https://www.chaibio.com/products/openpcr   なぜか http://openpcr.org/  で購入できなかったので、eBay にある ChaiBio で買いました。   OpenPCR - eBay http://www.ebay.com/itm/111096418574   本体価格は

R でいまどきなパッケージ開発 (devtools, testthat, roxygen2)

追記 (2012/04/21): 以下のコードは S4 classes で書いていますが、R5 reference classes で書き直してみました。こちらもどうぞ。 http://blog.hackingisbelieving.org/2012/04/r5-reference-class-r-devtools-testthat.html R のパッケージ開発の情報があまりないので、自分はこんな感じでやってます、というのを書いてみます。パッケージ開発支援の devtools と単体テスト支援の testthat, そしてドキュメント生成支援の roxygen を使うのがいまどきっぽいです。 そもそもパッケージを作製しているひとをあまりみたことがないので、もっとこうすべき、というのがあれば教えてほしいです。 今回はデモケースとして S4 OOP で、Idol クラスを定義し、とある身体的特徴の統計量を計算するパッケージを作ります。R のプロンプトは > で、シェルのプロンプトは $ で示しています。 0. 準備 必要になるパッケージをインストールします。 $ sudo R > install.packages(devtools) > install.packages(testthat) > q() devtools の設定をします。~/.Rpackages に設定を記述します。 $ emacs ~/.Rpackages list(   default = function(x) {     file.path("~/Project/dev/R/", x, x)   },   "idol" = "~/Projects/dev/R/idol/idol" ) 以下の行は今回パッケージを作製する作業ディレクトリになります。   "idol" = "~/Projects/dev/R/idol/idol" 1. ともあれ実装を始める 作業ディレクトリに移動します。 $mkdir -p ~/Project/dev/R/idol $ cd ~