スキップしてメイン コンテンツに移動

Quartz-Seqで1細胞/微量RNA-Seqを始めたい方へ

はじめに

新しい高精度な1細胞RNA-Seq, Quartz-Seq論文を出してから、各方面から多く相談を受けています。


そこで、新しく1細胞RNA-Seqを始める方へ、僕達が理想だと考えている技術導入の手順を紹介したいと思います。また我々の方法は1細胞(6-14 pg Total RNA)だけでなく pg-ng オーダーの少量RNAからシーケンスが可能です。そのような方も以下の手順が参考になると思います。

0. 1細胞/微量RNA-Seqが本当に必要なのか検討する

1細胞/微量RNA-Seqでは、現時点でQuartz-Seqが世界最高の性能を持っている訳ですが、十分なサンプルを用意し、通常のRNA-Seqしたほうが、より精度の高いデータが得られます。なので、基本的には、サンプルをたくさん集める方法をしっかり検討すべきです。まずは、戦略面と技術面で1細胞/微量RNA-Seqが本当に必要かを検討する基準について書きます。

0.1. 戦略面での検討

あなたが抱えているプロジェクトが、1細胞/微量RNA-Seqでなければアプローチできないかどうかを問い直すことが重要です。

基本的には以下の2つの状況で、1細胞/微量RNA-Seqが役に立ちます。

a. 細胞状態が連続的に変化し、さまざまな細胞状態が、細胞集団に含まれている場合 (振動現象、ゆらぎなど)
b. 細胞状態を特定するマーカーがほどんどわかっていない場合

最初から細胞状態が2状態しかないことが明らかで、しかも細胞状態を代表する遺伝子が分かっている、という状況では、FACSなどで cell sorting し、目的の細胞を採取することを考えるべきです。そして、微量RNA-Seqや通常のRNA-Seqで、しっかりと biological replication を取る方が良いでしょう。微量になると、テクニカルなノイズが増えるために、生物学的な差を知るためには、n をしっかり確保するのが重要です。もしかしたらRNA-Seqでなく、qPCRでも十分かもしれません。

0.2. 技術面での検討

1-10 ng 程度の Total RNA でも illumina 社 TruSeq RNA prep kit で十分シーケンス可能です。その場合は、ロスの少ないRNA抽出法を用いるのがポイントになります。そのためにお使いの細胞がどのぐらいRNAを持っているか定量することが重要です。まず細胞数をカウントしRNAを抽出・定量します。その後、1細胞あたりのRNA量を計算します。一般的には、2-20 pg あたりになります。

1細胞ではなく微量RNA-Seqのプロトコールはこちら。ライブラリ作製にもコツがあります。短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

まとめ
- 1細胞RNA-Seqである必然性を検討する
- 確保できるRNA量と biological replication の数を検討する
- 1細胞でなくてよいなら、ロスの少ないRNA精製法と通常のRNA-Seq法を試す
- 1細胞あたりのTotal RNA量を定量する

1. Quartz-Seqの導入

1.1. Quartz-Seq を導入

これまでの1細胞RNA-Seq法と異なり、Quartz-Seqは、簡便でロバストな方法なので、プロトコールを読みながら、自分でやってみると良いでしょう。笹川さんが丁寧にプロトコールを書いてくれました。
まず1細胞相当RNAを用意しましょう。細胞数をカウントしたのち、RNAを抽出、1細胞相当まで希釈します。これを1細胞と見立てて、Quartz-Seqの導入に利用します。このときは本番で利用する細胞ではなく、大量にRNAが手に入る細胞を利用することをお勧めします。またその細胞の通常のRNA-Seqを先にしておくことを強く推奨します。

重要な注意点はプロトコールに書いてありますので、そちらを見てください。温度や時間などひとつひとつに意味があります。なのでまずはそれらを一切変更せずに行うことが重要です。意味については論文のサプリメントにしっかり書いてあります。試薬はなるべくフレッシュなものを利用してください。業者によってはメーカーから購入後、業者に在庫として抱えている場合があります。このような場合は在庫するまでの間に試薬の状態が変化している可能性も考えられます。メーカーが届いたらその足でラボに届けてもらうようにお願いしましょう。

こちらも、短い断片を漏れなくライブラリ化するために、必ずLIMprepを利用してください。

1.2. 導入できたかどうかを判断するには

Quartz によるWTA (Whole transcript amplification) が終了した時点で、cDNAを電気泳動し、そのバンドパターンを見てください。正しいバンドパターンは論文に出ています。200bp 程度の副産物出ていないことも確認してください。

次にcDNA収量を確認し、期待できるだけ増えているかを確認します。それらを数回繰り返し、そのばらつきをCV (変動係数)で定量化し、安定したことを確認してください。

その後、その細胞で発現している遺伝子を10-30遺伝子程度選び、得られた cDNA に対して、qPCRをしてください。この時、発現量が高い遺伝子、中程度のもの、低いものをまんべんなく選ぶのがポイントです。生物学的現象を追っている人は、その現象に関わる遺伝子の qPCR をする人が多いですが、技術的な評価には、バイアスのない遺伝子の選択が重要になります。qPCRデータを scatter plot にし、線形回帰分析でR^2(決定係数), R(相関係数) をそれぞれ計算します。また遺伝子ごとに CV を計算し、x軸にその遺伝子の発現量、y軸にCVをプロットし、ばらつきがどの発現量域で表われるかを観察します。

ちなみに、我々は、8回の独立した増幅をした後、それらに対して30遺伝子程度の qPCR を行い、性能評価を行いました。もう少し遺伝子数は減らしても大丈夫だと思います。あるいは MiSeq でシーケンスしたほうが早いかもしれません。最終的には、シーケンスを行い、複数回の増幅のピアソン相関係数を確認し、少なくとも0.8、できれば0.9を越えることを確認しましょう。

最終的にはシーケンスして確認します。独立して増幅したサンプルをRNA-Seqします。また通常のRNA-Seqもします。これらを qPCRと同様の方法で比較します。検出された遺伝子数を確認します。通常のRNA-Seqや独立した増幅サンプルで、8割以上の遺伝子が検出されていることを確認してください。

まとめ
- 1細胞相当のTotal RNAを用意する
- cDNAの泳動像と収量を確認する
- qPCRとシーケンスで定量し, 相関係数とCV、検出遺伝子数で性能・安定性の評価をする

2. 細胞の採取

1細胞や微量サンプルを採取する方法を確立します。ここは我々の専門ではないので、各々が持つ技術に応じて、細胞を採取する系を立ち上げてください。我々の経験としては、ガラスピペットを利用してマニュアルで採取しても Qaurtz-Seqが上手くいくことを確かめています。

ポイントは以下の2点です。

a. 細胞と一緒に持ち込んでしまう液量を減らす、あるいは一定にすること
b. 細胞が破砕・融解されていること

a に関しては、1細胞sorting が理想です。bに関しては、顕微鏡で細胞が融けていることをしっかり確認しプロトコールを確立してください。細胞がしっかり解けなければ、RNAが細胞の外に出てこないせいか、うまく反応が進まないことがあります。ここを越えれば、あとはプロトコールにしたがって、Quartz-Seq を進めるのみです。

まとめ
- 1細胞を採取し、細胞を融解する条件を作っておくこと

3. 検証実験の立ち上げ

RNA-Seq や Microarray をした後、必ず qPCR, ISH, RNA FISH などで検証すると思います。1細胞RNA-Seqも同様に、なんらかの検証をする必要があります。Quartz-SeqはRNAを増幅する技術ですので、理想的には増幅せずに、まったくの別法で確認すべきです。しかし、既存の1細胞qPCRは、増幅が必要な方法ばかりです。そこで、我々の論文では、非PCRの1細胞qPCRも提案しています。詳しくは論文を読んでください。また、ISHやRNA FISH を立ち上げておくのもよいでしょう。このような系を持っておくと、データを論文化までのスピードが格段に上がると思います。特にシーケンス実験は解析も含めると時間がかかるので、その間に、必ず立ち上げておきましょう。

まとめ
- Qaurtz-Seqの結果を評価する実験系を持ちましょう

4. シーケンス実験計画

Quartz-Seqは illumina 社HiSeqを前提としていますが、cDNAができたらDNA用のシーケンスライブラリキッドと併せて、どのようなシーケンサーでも読めると思います。

シーケンスリード数はQuartz-Seqのダイナミックレンジに影響します。最低でも2000万リード程度(マッピング後)は欲しいところです。論文では、3000-6000万リードぐらいでデータを出しています。HiSeq 2500, 4-8 sample/lane を目安にすると良いでしょう。リード数とダイナミックレンジの関係は論文のサプリメントを確認してください。

ライブラリ作製は Quartz-Seq 用の LIMprep 法を利用してください。

1細胞RNA-Seqは数細胞だけ行なってもその後の解析は不可能です。細胞集団にどのぐらいの比率で異質性があるかを想定して、シーケンスする細胞数を決定しましょう。例えば10個に1つの異質性をみるのに、10細胞以下で実験しても意味がない、ということです。まずは20細胞ぐらいを目標にしてみると良いと思います。そのぐらいあれば一般的な多変量解析の手法が意味を持って使えると思います。

もし、細胞周期の影響を除きたい場合は、FACSなどで細胞周期が同じ細胞のみ採取すると良いでしょう。

最後に費用ですが、シーケンス費用を除いた、Quartz WTAについては 500円/sample です。

まとめ
- 4-8 cells/lane, 2000万リード以上
- 20細胞以上
- Quartz WTAは1反応が500円

5. データ解析

1細胞だからと言って特別な解析はないですが、Quartz-Seqなど1細胞RNA-Seqのデータをみるときの注意を書いておきます。

まず、プライマー配列が標的のmRNAに対して極端に多いので、どうしてもシーケンスデータに含まれます。なので、FASTQからプライマ配列を trimming しましょう。Quartz-Seq の場合は、8%程度コンタミします。それ以上の場合は、suppression PCRやプライマー除去のステップがうまくいっていない可能性があります。

また通常のRNA-Seqの場合は、数十から数万細胞に1コピーのRNAがあっても定量されます。なので、そのような遺伝子のついても数値化する意味があるかもしれません。しかし1細胞RNA-Seqの場合は、1細胞に1コピー以下、ということを考える意味がないため、1コピー以下に相当するデータをプロットしたり、解析に利用する必要はあまりありません。

まとめ
- プライマー配列をトリミングする
- 1コピー以下を考える必要はない

最後に

我々は、新しいシーケンス技術を作ることに喜びを覚えており、Quartz-Seqが広く使われることを望んでいます。今後も以下のサイトで情報公開を行なっていきます。我々の方法があなたの研究の役に立てば幸いです。がんばってください!

コメント

このブログの人気の投稿

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。 まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。 気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。 From Evernote: シーケンスアダプタ配列除去ツールまとめ TagDust http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash 使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq 解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple

ChIP-seq の Peak calling tool を集めたよ

ほかにもあったら教えてください。プログラム/プロジェクト名がツールのプロジェクトサイトへのリンク。その論文タイトルは論文へのリンクになっています。 ツール名の50音順です。 CCCT -  A signal–noise model for significance analysis of ChIP-seq with negative control , chipdiff と同じグループ CisGenome -  CisGenome: An integrated software system for analyzing ChIP-chip and ChIP-seq data . ChromSig -  ChromaSig: a probabilistic approach to finding common chromatin signatures in the human genome. ChIPDiff -  An HMM approach to genome-wide identification of differential histone modification sites from ChIP-seq data ChIP-Seq Analysis Server FindPeaks -  FindPeaks 3.1: a tool for identifying areas of enrichment from massively parallel short-read sequencing technology. Version 4.0 is out. GLITR -  Extracting transcription factor targets from ChIP-Seq data HPeak -  HPeak: an HMM-based algorithm for defining read-enriched regions in ChIP-Seq data MACS -  Model-based Analysis of ChIP-Seq (MACS). PeakSeq -  PeakSeq enables systematic scoring of ChIP-seq experimen

大学の研究室でアカデミックプランが使えるICTツール

自分らでサーバ管理したくないので、SaaS系とローカルで動くソフトのみ。ローカルで動くソフトに関しては、Mac or Docker で動くもののみ。 無償 G Suite for Education  (ドキュメント共有、カレンダーなど) GitHub Education  (ソースコード管理) esa.io アカデミックプラン  (知識共有) Tableau  (データ可視化) Scrapbox  (知識共有) GROWI.cloud  (Wikiなど) 割引 Slack の教育支援プログラム  (ビジネスチャット) Dropbox Education  (ファイル共有、ドキュメント共有) Office 356  (オフィスソフト) Adobe Creative Cloud  (画像編集) AutoDesk for Education  (CADなど) これから申し込んでいくところなので、本当に使えるかはわかりせん。使えた使えないなどの情報やほかのツールでお勧めがあれば教えてもらえると嬉しいです。 アカデミアでなくても無料で使えるツールのうち、うちで使うであろうものは以下に列挙していく。 Google Colaboratory  (データ解析) Overleaf  (論文執筆) Rstudio  (開発, データ解析) VS code (開発)