スキップしてメイン コンテンツに移動

!他の言語とセットでどうぞ

[[最もタメになる「初心者用言語」まとめ|http://generation1986.g.hatena.ne.jp/ukstudio/20080204/1202113687]] (リンクされた,THX)

うっかりTwitterで[[乗りおくれた! 最もタメになる「初心者用言語」は R。ってもう誰か書いた?|http://twitter.com/dritoshi/statuses/676548832]]とかつぶやいたら,
[[@dritoshi 書いて!|http://twitter.com/syou6162/statuses/676551442]]って言われたので,ムリがあるけど俺,がんばった.

[[R|http://www.r-project.org/]]

筋は悪くないよ.CLOSから取り入れた総称的関数が大活躍だし.なのにカッコカッコしてない! もちろんオブジェクト指向プログラミングもできるしユニットテストもあるよ.統計言語だからデータ構造も豊富! ガベコレもあるよ.無名関数もあるよ.例外処理,遅延評価,関数クロージャ,再帰もできるし,自在にベクトル計算ができるから複雑なループを作らなくてもいいよ.applyかわいいよapply

(なんかまともだ,ということしか言ってないな.初心者向けとかの話じゃないwww)

プログラムや関数を作ってみたけどデータがないよ,自分でなんとかしろって初心者に全然やさしくない.Rのほんどの関数にはサンプルデータが付いているよ.example()に関数を渡すだけで,その関数がサンプルデータを使って実行されるよ.
> example(t.test)

ソースを読むことがプログラミング上達にかかせないことは異論がないよね.R関数の多くはRで書かれている.しかも単に関数名を打つとそのコードがずらずら表示さえるよ.他の言語ではこうはいかないよね.

JSとかでグラフを書くライブラリとかがホッテンリストとかいっちゃうけどそのあたりは本職.データ構造が違っても同じ名前の関数で良い具合のグラフを出してくれるよ.総称的関数のおかげだね.あと地味に重要なことだけどGDとかImageMagickのインストールで泣くこともないよ.

Rはライブラリがすごく豊富.様々な統計解析から画像解析,SOAPのライブラリまでいろいろあるよ.PerlのCPANみたいに[[CRAN|http://cran.r-project.org/]]というのがあって,依存関係を見ながらネットワークインストールとか余裕だよ.しかも複雑になりすぎたCPANみたいにインストールが失敗することが少ないよ.しかも統計科学の最先端の研究成果ががんがんCRANに登録されるよ
> install.package(hogehoge)

GUIの付いた専用シェルがバイナリで容易されているので,普通のソフトをインストールするのと手間は変わらないよ.環境変数がどうとかそんなことは知らなくてもすぐに使えるよ.

Rって検索しにくい >< でも心配なーい.http://www.okada.jp.org/RWiki/ とか http://aoki2.si.gunma-u.ac.jp/R/ とか http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html とか見てごらんよ.なにこの充実ぶり.やばすぎ.

他の言語は「仕掛け」を作るのは得意だけど「分析」とかは苦手.仕掛けを作ったら分析して,その分析からまた何か新しいものを作る.Rを覚えるとほかの言語との相乗効果がでるよ.「タメ」になるよ,きっと.

とりあえずリゲスを読んどけ.つ {{isbn '4431712186

追記: あと言語オタクなMatzさんとかでもRとかOctaveとかScilabとかMatlabとかMathematicaとかは追ってなさそうだからパイオニアになれるよ.そしていつか言語作っちゃいなYO!

コメント

このブログの人気の投稿

シーケンスアダプタ配列除去ツールまとめ

FASTQ/A file からシーケンスアダプター配列やプライマー配列を除くためのプログラムをまとめてみる。 まず、配列の除去には大別して2つの方向性がある。ひとつは、アダプター配列を含む「リード」を除いてしまう方法。もうひとつは除きたい配列をリードからトリムする方法である。後者のほうが有効リードが増えるメリットが、綺麗に除ききれない場合は、ゲノムへのマップ率が下がる。 気をつける点としては、アダプター/プライマーの reverse complement を検索するかどうか。paired end の際には大事になる。クオリティでトリムできるものや、Paired-end を考慮するものなどもある。アダプター/プライマー配列の文字列を引数として直接入力するものと、multi fasta 形式で指定できるももある。 From Evernote: シーケンスアダプタ配列除去ツールまとめ TagDust http://genome.gsc.riken.jp/osc/english/software/src/nexalign-1.3.5.tgz http://bioinformatics.oxfordjournals.org/content/25/21/2839.full インストール: curl -O http://genome.gsc.riken.jp/osc/english/software/src/tagdust.tgztar zxvf tagdust.tgz cd tagdust/ make sudo make install rehash 使いかた: tagdust adapter.fasta input.fastq -fdr 0.05 -o output.clean.fastq -a output.artifactual.fastq 解説: 入出力形式は fastq/a が使える。リード全体を除く。速い。アダプター配列を fasta 形式で入力できるのが地味に便利で、これに対応しているものがなかなかない。Muth–Manber algorithm (Approximate multiple

ChIP-seq の Peak calling tool を集めたよ

ほかにもあったら教えてください。プログラム/プロジェクト名がツールのプロジェクトサイトへのリンク。その論文タイトルは論文へのリンクになっています。 ツール名の50音順です。 CCCT -  A signal–noise model for significance analysis of ChIP-seq with negative control , chipdiff と同じグループ CisGenome -  CisGenome: An integrated software system for analyzing ChIP-chip and ChIP-seq data . ChromSig -  ChromaSig: a probabilistic approach to finding common chromatin signatures in the human genome. ChIPDiff -  An HMM approach to genome-wide identification of differential histone modification sites from ChIP-seq data ChIP-Seq Analysis Server FindPeaks -  FindPeaks 3.1: a tool for identifying areas of enrichment from massively parallel short-read sequencing technology. Version 4.0 is out. GLITR -  Extracting transcription factor targets from ChIP-Seq data HPeak -  HPeak: an HMM-based algorithm for defining read-enriched regions in ChIP-Seq data MACS -  Model-based Analysis of ChIP-Seq (MACS). PeakSeq -  PeakSeq enables systematic scoring of ChIP-seq experimen

大学の研究室でアカデミックプランが使えるICTツール

自分らでサーバ管理したくないので、SaaS系とローカルで動くソフトのみ。ローカルで動くソフトに関しては、Mac or Docker で動くもののみ。 無償 G Suite for Education  (ドキュメント共有、カレンダーなど) GitHub Education  (ソースコード管理) esa.io アカデミックプラン  (知識共有) Tableau  (データ可視化) Scrapbox  (知識共有) GROWI.cloud  (Wikiなど) 割引 Slack の教育支援プログラム  (ビジネスチャット) Dropbox Education  (ファイル共有、ドキュメント共有) Office 356  (オフィスソフト) Adobe Creative Cloud  (画像編集) AutoDesk for Education  (CADなど) これから申し込んでいくところなので、本当に使えるかはわかりせん。使えた使えないなどの情報やほかのツールでお勧めがあれば教えてもらえると嬉しいです。 アカデミアでなくても無料で使えるツールのうち、うちで使うであろうものは以下に列挙していく。 Google Colaboratory  (データ解析) Overleaf  (論文執筆) Rstudio  (開発, データ解析) VS code (開発)