スキップしてメイン コンテンツに移動

投稿

11月, 2011の投稿を表示しています

R/Bioconductor のパッケージ作成に役立つリンク集

From Evernote: R/Bioconductor のパッケージ作成に役立つリンク集 R や Bioconductor のパッケージ作成について、参考になりそうなリンク集を集めました。
Creating R Packages: A Tutorial http://cran.r-project.org/doc/contrib/Leisch-CreatingPackages.pdf Rパッケージ作成に関するチュートリアルのテキスト。これを一通りやれば作れるようになる。S3, S4 classes についても書いてある。R5 classes については書いてない。
Building Packages http://www.bioconductor.org/help/course-materials/2010/AdvancedR/BuildPackage.pdf
R packages 作成に必要な基礎知識をまとめた資料。プレゼン形式なので要点がまとまっていて読みやすい。BioC について一部書いてある。
Building Packages: Self-Study Exercises http://www.bioconductor.org/help/course-materials/2011/AdvancedRFeb2011Seattle/BuildPackage-lab.pdf 同じく Wong さんの資料。パッケージ作成の演習問題。
Seminar III: R/Bioconductor http://www.lcg.unam.mx/~lcollado/B/lectures/packages/packages.pdf これもBioCライブラリ作成のレクチャー資料。プレゼン形式。要点がまとまっていてよい。
Authoring R Packages http://www.bioconductor.org/help/course-materials/2008/advanced_R/packages.pdf Rパッケージの仕組みについてのレクチャーの資料。プレゼン形式。BioCについては書いてない。
Bioconductor Developers  http://www.bioconductor.org/developers/ BioCの公式文章がいろいろある。

Writing…

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。

まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。
気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。

From Evernote: シーケンスアダプタ配列除去ツールまとめTagDust
http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full
インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash
使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq
解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple string search) を利用。FDRを指定できる。GPL3

Evernote から blogger に投稿するテスト

From Evernote: Evernote から blogger に投稿するテスト ここの blog エントリはだいたい Evernote に書いてあるメモを修正して公開している。Evernote にはノートをメール送信する機能があるので、それを使って blogger に投稿できるか試してみる。

リンクが張れるか? http://blog.hackingisbelieving.org/
画像が張れるか?
フォント情報は維持されるか? サイズのテスト 色のテスト スタイルのテスト フォントの種類
hogefugapiyo チェックボックス
Table テーブルほげ
ふが
hr --- ここまで Evernote で書いた ---

おお、できるね! これはラクチンかも。画像もちゃんと投稿される!

そもそも Evernote にメモを取るようになってから blog を書く頻度が非常に下がったが、Evernote のメモを blogger に簡単に投稿できるようになると、少しは更新頻度が上がるかも。

blogger の設定画面から、メール投稿機能を ON にしておく必要あり。いきなり投稿することもできるし、下書きにいれることも可能。これで Evernote のほうを更新すると自動的に blogger も更新されると嬉しいのだが...

先取り! Bioconductor 2.9で追加される ChIP-seq 関連の Library

先取りして、BioC 2.9で追加される ChIP-seq 関連の Library を一行解説とともにリストしてみた。
BCRANK: Predicting binding site consensus from ranked DNA sequences http://www.bioconductor.org/packages/2.9/bioc/html/BCRANK.html
DiffBind: differential binding analysis of ChIP-Seq peak data ChIP-seq データの比較に焦点を当てたツール。Overlap 計算、Boxplot, PCA biplot, heatmap による可視化、edgeR, DESeq をつかった binding affinity 解析 http://www.bioconductor.org/packages/2.9/bioc/html/DiffBind.html
PMAPPER: R interface to the MAPPER database of transcription factor binding sites TFBS の database である MAPPER (http://genome.ufl.edu/mapper/) の API http://www.bioconductor.org/packages/2.9/bioc/html/RMAPPER.html
ChIPsim: Simulation of ChIP-seq experiments ChIP-seq のシミュレーションをする。現在のところ nucleosome ChIP-seq にフォーカス http://www.bioconductor.org/packages/2.9/bioc/html/ChIPsim.html
iSeq: Bayesian Hierarchical Modeling of ChIP-seq Data Through Hidden Ising Models 隠れイジングモデルを使った binding site の同定。手法の元論文は、Q Mo, 2011. A fully Bayesian hidden Ising model for ChIP-seq data analysis, …