突然ですが「シリーズ: 良質なR package のコードを読むよ」が俺のなかだけで始まりました。 良質のRコードといえば、 Bioconductor (以下、BioC) ですね。ここでは BioC を読んでいきますが、すべての R ユーザに有益なはずです。あまり BioC だと気付かずに使っているパッケージもあるはずよ。R本体のコードを読む訳ではありませんので誤解なきよう。 目次 第1回: Bioconductor のパッケージについて知る 第2回: Bioconductor のソースコードを得る 第3回: Bioconductor にはS4で書かれたコードがどのぐらいあるか (連載中) なぜ Bioconductor を読むのか? BioC は R を開発しているメンバーと重なっているのでコードの質が高い(と期待 コードレビューされているので質が高い(と期待 S4を推奨しているので S4 OOP な R コードが読める なにをするのか? BioCのコードを読み進めたときに書いたメモをアップしていきます。メモなのであまり読者を想定していません。よーわからん、という人は元の情報に当たるか、聞いてください。 BioCパッケージについて知る さて本題です。今回は、R パッケージに求められることや、その構造を知るため、 Bioconductor パッケージガイドライン と パッケージサブミッションガイド を読みます。 あまり細かいことを書いてもしょうがないので、ざっくりとサマリを書きます。BioCは特にコードの質とドキュメンテーションについてこだわっていることがわかります。 BioCのパッケージは以下の条件を満す必要があります。すべて must です。 1. R CMD build, R CMD check が通ること Windows, Mac, Linux の3つのプラットフォームでチェックが通る必要があります。 2. 重複がないこと パッケージ名の重複をチェック [code] source("http://bioconductor.org/biocLite.R"); biocLite("mypackage") [/code] 混乱を避けるためCRANとBioCの両方をパッケージを登録してはいけません。 またすでにあるパッケージ