スキップしてメイン コンテンツに移動

Quartz-Seqで1細胞/微量RNA-Seqを始めたい方へ

はじめに

新しい高精度な1細胞RNA-Seq, Quartz-Seq論文を出してから、各方面から多く相談を受けています。


そこで、新しく1細胞RNA-Seqを始める方へ、僕達が理想だと考えている技術導入の手順を紹介したいと思います。また我々の方法は1細胞(6-14 pg Total RNA)だけでなく pg-ng オーダーの少量RNAからシーケンスが可能です。そのような方も以下の手順が参考になると思います。

0. 1細胞/微量RNA-Seqが本当に必要なのか検討する

1細胞/微量RNA-Seqでは、現時点でQuartz-Seqが世界最高の性能を持っている訳ですが、十分なサンプルを用意し、通常のRNA-Seqしたほうが、より精度の高いデータが得られます。なので、基本的には、サンプルをたくさん集める方法をしっかり検討すべきです。まずは、戦略面と技術面で1細胞/微量RNA-Seqが本当に必要かを検討する基準について書きます。

0.1. 戦略面での検討

あなたが抱えているプロジェクトが、1細胞/微量RNA-Seqでなければアプローチできないかどうかを問い直すことが重要です。

基本的には以下の2つの状況で、1細胞/微量RNA-Seqが役に立ちます。

a. 細胞状態が連続的に変化し、さまざまな細胞状態が、細胞集団に含まれている場合 (振動現象、ゆらぎなど)
b. 細胞状態を特定するマーカーがほどんどわかっていない場合

最初から細胞状態が2状態しかないことが明らかで、しかも細胞状態を代表する遺伝子が分かっている、という状況では、FACSなどで cell sorting し、目的の細胞を採取することを考えるべきです。そして、微量RNA-Seqや通常のRNA-Seqで、しっかりと biological replication を取る方が良いでしょう。微量になると、テクニカルなノイズが増えるために、生物学的な差を知るためには、n をしっかり確保するのが重要です。もしかしたらRNA-Seqでなく、qPCRでも十分かもしれません。

0.2. 技術面での検討

1-10 ng 程度の Total RNA でも illumina 社 TruSeq RNA prep kit で十分シーケンス可能です。その場合は、ロスの少ないRNA抽出法を用いるのがポイントになります。そのためにお使いの細胞がどのぐらいRNAを持っているか定量することが重要です。まず細胞数をカウントしRNAを抽出・定量します。その後、1細胞あたりのRNA量を計算します。一般的には、2-20 pg あたりになります。

1細胞ではなく微量RNA-Seqのプロトコールはこちら。ライブラリ作製にもコツがあります。短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

まとめ
- 1細胞RNA-Seqである必然性を検討する
- 確保できるRNA量と biological replication の数を検討する
- 1細胞でなくてよいなら、ロスの少ないRNA精製法と通常のRNA-Seq法を試す
- 1細胞あたりのTotal RNA量を定量する

1. Quartz-Seqの導入

1.1. Quartz-Seq を導入

これまでの1細胞RNA-Seq法と異なり、Quartz-Seqは、簡便でロバストな方法なので、プロトコールを読みながら、自分でやってみると良いでしょう。笹川さんが丁寧にプロトコールを書いてくれました。
まず1細胞相当RNAを用意しましょう。細胞数をカウントしたのち、RNAを抽出、1細胞相当まで希釈します。これを1細胞と見立てて、Quartz-Seqの導入に利用します。このときは本番で利用する細胞ではなく、大量にRNAが手に入る細胞を利用することをお勧めします。またその細胞の通常のRNA-Seqを先にしておくことを強く推奨します。

重要な注意点はプロトコールに書いてありますので、そちらを見てください。温度や時間などひとつひとつに意味があります。なのでまずはそれらを一切変更せずに行うことが重要です。意味については論文のサプリメントにしっかり書いてあります。試薬はなるべくフレッシュなものを利用してください。業者によってはメーカーから購入後、業者に在庫として抱えている場合があります。このような場合は在庫するまでの間に試薬の状態が変化している可能性も考えられます。メーカーが届いたらその足でラボに届けてもらうようにお願いしましょう。

こちらも、短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

1.2. 導入できたかどうかを判断するには

Quartz によるWTA (Whole transcript amplification) が終了した時点で、cDNAを電気泳動し、そのバンドパターンを見てください。正しいバンドパターンは論文に出ています。200bp 程度の副産物出ていないことも確認してください。

次にcDNA収量を確認し、期待できるだけ増えているかを確認します。それらを数回繰り返し、そのばらつきをCV (変動係数)で定量化し、安定したことを確認してください。

その後、その細胞で発現している遺伝子を10-30遺伝子程度選び、得られた cDNA に対して、qPCRをしてください。この時、発現量が高い遺伝子、中程度のもの、低いものをまんべんなく選ぶのがポイントです。生物学的現象を追っている人は、その現象に関わる遺伝子の qPCR をする人が多いですが、技術的な評価には、バイアスのない遺伝子の選択が重要になります。qPCRデータを scatter plot にし、線形回帰分析でR^2(決定係数), R(相関係数) をそれぞれ計算します。また遺伝子ごとに CV を計算し、x軸にその遺伝子の発現量、y軸にCVをプロットし、ばらつきがどの発現量域で表われるかを観察します。

ちなみに、我々は、8回の独立した増幅をした後、それらに対して30遺伝子程度の qPCR を行い、性能評価を行いました。もう少し遺伝子数は減らしても大丈夫だと思います。あるいは MiSeq でシーケンスしたほうが早いかもしれません。最終的には、シーケンスを行い、複数回の増幅のピアソン相関係数を確認し、少なくとも0.8、できれば0.9を越えることを確認しましょう。

最終的にはシーケンスして確認します。独立して増幅したサンプルをRNA-Seqします。また通常のRNA-Seqもします。これらを qPCRと同様の方法で比較します。検出された遺伝子数を確認します。通常のRNA-Seqや独立した増幅サンプルで、8割以上の遺伝子が検出されていることを確認してください。

まとめ
- 1細胞相当のTotal RNAを用意する
- cDNAの泳動像と収量を確認する
- qPCRとシーケンスで定量し, 相関係数とCV、検出遺伝子数で性能・安定性の評価をする

2. 細胞の採取

1細胞や微量サンプルを採取する方法を確立します。ここは我々の専門ではないので、各々が持つ技術に応じて、細胞を採取する系を立ち上げてください。我々の経験としては、ガラスピペットを利用してマニュアルで採取しても Qaurtz-Seqが上手くいくことを確かめています。

ポイントは以下の2点です。

a. 細胞と一緒に持ち込んでしまう液量を減らす、あるいは一定にすること
b. 細胞が破砕・融解されていること

a に関しては、1細胞sorting が理想です。bに関しては、顕微鏡で細胞が融けていることをしっかり確認しプロトコールを確立してください。細胞がしっかり解けなければ、RNAが細胞の外に出てこないせいか、うまく反応が進まないことがあります。ここを越えれば、あとはプロトコールにしたがって、Quartz-Seq を進めるのみです。

まとめ
- 1細胞を採取し、細胞を融解する条件を作っておくこと

3. 検証実験の立ち上げ

RNA-Seq や Microarray をした後、必ず qPCR, ISH, RNA FISH などで検証すると思います。1細胞RNA-Seqも同様に、なんらかの検証をする必要があります。Quartz-SeqはRNAを増幅する技術ですので、理想的には増幅せずに、まったくの別法で確認すべきです。しかし、既存の1細胞qPCRは、増幅が必要な方法ばかりです。そこで、我々の論文では、非PCRの1細胞qPCRも提案しています。詳しくは論文を読んでください。また、ISHやRNA FISH を立ち上げておくのもよいでしょう。このような系を持っておくと、データを論文化までのスピードが格段に上がると思います。特にシーケンス実験は解析も含めると時間がかかるので、その間に、必ず立ち上げておきましょう。

まとめ
- Qaurtz-Seqの結果を評価する実験系を持ちましょう

4. シーケンス実験計画

Quartz-Seqは illumina 社HiSeqを前提としていますが、cDNAができたらDNA用のシーケンスライブラリキッドと併せて、どのようなシーケンサーでも読めると思います。

シーケンスリード数はQuartz-Seqのダイナミックレンジに影響します。最低でも2000万リード程度(マッピング後)は欲しいところです。論文では、3000-6000万リードぐらいでデータを出しています。HiSeq 2500, 4-8 sample/lane を目安にすると良いでしょう。リード数とダイナミックレンジの関係は論文のサプリメントを確認してください。

ライブラリ作製は Quartz-Seq 用の LIMprep 法を利用してください。

1細胞RNA-Seqは数細胞だけ行なってもその後の解析は不可能です。細胞集団にどのぐらいの比率で異質性があるかを想定して、シーケンスする細胞数を決定しましょう。例えば10個に1つの異質性をみるのに、10細胞以下で実験しても意味がない、ということです。まずは20細胞ぐらいを目標にしてみると良いと思います。そのぐらいあれば一般的な多変量解析の手法が意味を持って使えると思います。

もし、細胞周期の影響を除きたい場合は、FACSなどで細胞周期が同じ細胞のみ採取すると良いでしょう。

最後に費用ですが、シーケンス費用を除いた、Quartz WTAについては 500円/sample です。

まとめ
- 4-8 cells/lane, 2000万リード以上
- 20細胞以上
- Quartz WTAは1反応が500円

5. データ解析

1細胞だからと言って特別な解析はないですが、Quartz-Seqなど1細胞RNA-Seqのデータをみるときの注意を書いておきます。

まず、プライマー配列が標的のmRNAに対して極端に多いので、どうしてもシーケンスデータに含まれます。なので、FASTQからプライマ配列を trimming しましょう。Quartz-Seq の場合は、8%程度コンタミします。それ以上の場合は、suppression PCRやプライマー除去のステップがうまくいっていない可能性があります。

また通常のRNA-Seqの場合は、数十から数万細胞に1コピーのRNAがあっても定量されます。なので、そのような遺伝子のついても数値化する意味があるかもしれません。しかし1細胞RNA-Seqの場合は、1細胞に1コピー以下、ということを考える意味がないため、1コピー以下に相当するデータをプロットしたり、解析に利用する必要はあまりありません。

まとめ
- プライマー配列をトリミングする
- 1コピー以下を考える必要はない

最後に

我々は、新しいシーケンス技術を作ることに喜びを覚えており、Quartz-Seqが広く使われることを望んでいます。今後も以下のサイトで情報公開を行なっていきます。我々の方法があなたの研究の役に立てば幸いです。がんばってください!

コメント

このブログの人気の投稿

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。 まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。 気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。 From Evernote: シーケンスアダプタ配列除去ツールまとめ TagDust http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash 使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq 解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple

ChIP-seq の Peak calling tool を集めたよ

ほかにもあったら教えてください。プログラム/プロジェクト名がツールのプロジェクトサイトへのリンク。その論文タイトルは論文へのリンクになっています。 ツール名の50音順です。 CCCT -  A signal–noise model for significance analysis of ChIP-seq with negative control , chipdiff と同じグループ CisGenome -  CisGenome: An integrated software system for analyzing ChIP-chip and ChIP-seq data . ChromSig -  ChromaSig: a probabilistic approach to finding common chromatin signatures in the human genome. ChIPDiff -  An HMM approach to genome-wide identification of differential histone modification sites from ChIP-seq data ChIP-Seq Analysis Server FindPeaks -  FindPeaks 3.1: a tool for identifying areas of enrichment from massively parallel short-read sequencing technology. Version 4.0 is out. GLITR -  Extracting transcription factor targets from ChIP-Seq data HPeak -  HPeak: an HMM-based algorithm for defining read-enriched regions in ChIP-Seq data MACS -  Model-based Analysis of ChIP-Seq (MACS). PeakSeq -  PeakSeq enables systematic scoring of ChIP-seq experimen

ふりかえり

2013年4月に独立して7年目が終わろうとしている。ざっくりこれまでの研究を振り返る。 2013年から2017年の4年はフルスタックのゲノム科学、ゲノムインフォのラボを立ち上げることに集中していた。しかも人様が作った技術のユーザとして研究するのではなく、新しい技術を開発できるラボを目指した。ウェットの開発については、ドライのPIであっても本物を創りたいと考えたので世界最強や唯一の技術を目指した。特に1細胞ゲノム科学に注力した。そのためにまずグラントを取り仲間を集め技術を作った。幸いウェットは元同僚を中心に、ドライはドクター新卒の優秀な人材に囲まれた。並行して開発した実験やデータ解析技術を応用するため、データ生産や共同研究を支えるチームも作った。 2015年ぐらいからドライの論文が少しずつ出始め、2018年にはウェットのフラッグシップとなる技術RamDA-seqとQuartz-Seq2の2つ出版された。2021年1月現在、これらはそれぞれ世界唯一と世界最高性能の2冠である。これが達成できた大きな理由のひとつは、反応原理を徹底的に理解し制御するというチームやそのメンバーの特性にある。ここは世界最高レベルだと確信している。 2017-2018年はラボの移転がありウェットの開発や実験が大きく停滞した。その間ドライのチームががんばってくれて2019-2020年にはドライ研究の収穫の時期がきた。またRamDA-seqの試薬キット化・装置化、Quartz-Seq2とそのデータ解析技術での起業、実験試薬や道具の上市など社会実装の年でもあった。実験が少なくなった分、ウェットのメンバーの解析技術がかなり向上した時期でもある。これはウェットとドライがうまくコミュニケーションできる証拠でもある。 2019-2020年はウェット技術のフラッグシップを駆使した共同研究がいくつか花咲いた。主に「再生医療分野」への応用と「細胞ゆらぎと転写制御の謎」に迫る基礎的なテーマが対象で、もともと1細胞ゲノム科学を始めたときに目標としたものだった。 並行してゲノムデータの科学計算環境のインフラ開発に注力してきた。beowulf型PCクラスタからクラウドの移行やハイブリッド化、DevOpsによる自動構築、ワークフロー言語の導入、動的レポート生成などの導入・開発を行いこれらを日常的に使うラボになった。これらはNI