Rで[[SBML|http://sbml.org/Main_Page]] (Systems Biology Markup Language) を読み込む方法を調べたのでメモします。RSBMLを使いDOMとして読み込みます。読み込んだDOMをRgraphvizで図示します。
SBMLは生物モデルを表現するためのXML言語で、多くのシミュレータなので採用されている言語規格です。具体的には遺伝子やタンパク質、代謝などのネットワークを表現するときに使います。ネットワーク構造と反応、反応に関するパラメータを格納することができます。
環境は MacBook Air と Mac OS X (10.5)、R 2.9.1です。
libsbmlを dmg でダウンロードしてインストールする。
http://sourceforge.net/projects/sbml/files/libsbml/3.4.1/libsbml-3.4.1-libxml2-macosx.dmg/download
RSBMLをインストールする。
<<<
sudo R
> source("http://bioconductor.org/biocLite.R")
> biocLite("RSBML")
>>>
Graphviz をインストールする。
http://www.ryandesign.com/graphviz/download/Graphviz%202.12%20Revision%203%20Intel.dmg
sudo cp /usr/local/graphviz-2.12/lib/libgvc.3.dylib /usr/local/lib/
Rgraphviz を入れる。
<<<
sudo R
> source("http://bioconductor.org/biocLite.R")
> biocLite("Rgraphviz")
>>>
SBMLを読み込む。まず適当なSBMLをどこかからゲットする
<<<
curl -O http://www.staff.ncl.ac.uk/d.j.wilkinson/smfsb/autoreg-2-1.xml
>>>
SBMLをDOMとして読み込む。S4オブジェクトになる。
<<<
R
> library(rsbml)
> dom <- rsbml_read("~/Desktop/autoreg-2-1.xml")
> dom
SBML Document (level = 2, version = 1)
Model of AutoRegulatoryNetwork (Auto-regulatory network)
Compartments (1):
Cell
Species (5):
Gene() in Cell
P2Gene(P2.Gene) in Cell
....
Rna() in Cell
P() in Cell
Reactions (8):
Gene + P2 -> P2Gene by k1 * Gene * P2 where k1 := 1
P2Gene -> Gene + P2 by k1r * P2Gene where k1r := 10
....
Gene -> Gene + Rna by k2 * Gene where k2 := 0.01
Rna -> Rna + P by k3 * Rna where k3 := 10
UnitDefinitions (1):
substance := item
>>>
Model の species ID へアクセスするには、みんな大好き apply family の sapply を使う。
<<<
> sapply(species(model(dom)), id)
Gene P2Gene Rna P P2
"Gene" "P2Gene" "Rna" "P" "P2"
>>>
Reactions も同じようにアクセスできる。
<<<
> sapply(reactions(model(dom)), id)
RepressionBinding ReverseRepressionBinding
"RepressionBinding" "ReverseRepressionBinding"
Transcription Translation
"Transcription" "Translation"
Dimerisation Dissociation
"Dimerisation" "Dissociation"
RnaDegradation ProteinDegradation
"RnaDegradation" "ProteinDegradation"
>>>
DOM を Rgraphviz で図示する。rsbml_graph で S4 オブジェクトを graph オブジェクトへ変換できる。あとは graph オブジェクトを操作できるライブラリ、例えば、Rgraphviz などで好きに操作できる。
<<<
> library(graph)
> g <- rsbml_graph(dom)
> g
A graphNEL graph with directed edges
Number of Nodes = 13
Number of Edges = 18
> nodes(g)
[1] "Gene" "P2Gene"
[3] "Rna" "P"
[5] "P2" "RepressionBinding"
[7] "ReverseRepressionBinding" "Transcription"
[9] "Translation" "Dimerisation"
[11] "Dissociation" "RnaDegradation"
[13] "ProteinDegradation"
> library(Rgraphviz)
> g.layout <- layoutGraph(g)
> pdf("autoreg-2-1.pdf")
> graph.par(list(nodes=list(fontsize=30)))
> renderGraph(g.layout)
> dev.off()
>>>
{{image 0, '画像の説明', nil, [500,500]}}
参考URLはここにまとめた。http://b.hatena.ne.jp/ichan/SBML/
SBMLは生物モデルを表現するためのXML言語で、多くのシミュレータなので採用されている言語規格です。具体的には遺伝子やタンパク質、代謝などのネットワークを表現するときに使います。ネットワーク構造と反応、反応に関するパラメータを格納することができます。
環境は MacBook Air と Mac OS X (10.5)、R 2.9.1です。
libsbmlを dmg でダウンロードしてインストールする。
http://sourceforge.net/projects/sbml/files/libsbml/3.4.1/libsbml-3.4.1-libxml2-macosx.dmg/download
RSBMLをインストールする。
<<<
sudo R
> source("http://bioconductor.org/biocLite.R")
> biocLite("RSBML")
>>>
Graphviz をインストールする。
http://www.ryandesign.com/graphviz/download/Graphviz%202.12%20Revision%203%20Intel.dmg
sudo cp /usr/local/graphviz-2.12/lib/libgvc.3.dylib /usr/local/lib/
Rgraphviz を入れる。
<<<
sudo R
> source("http://bioconductor.org/biocLite.R")
> biocLite("Rgraphviz")
>>>
SBMLを読み込む。まず適当なSBMLをどこかからゲットする
<<<
curl -O http://www.staff.ncl.ac.uk/d.j.wilkinson/smfsb/autoreg-2-1.xml
>>>
SBMLをDOMとして読み込む。S4オブジェクトになる。
<<<
R
> library(rsbml)
> dom <- rsbml_read("~/Desktop/autoreg-2-1.xml")
> dom
SBML Document (level = 2, version = 1)
Model of AutoRegulatoryNetwork (Auto-regulatory network)
Compartments (1):
Cell
Species (5):
Gene() in Cell
P2Gene(P2.Gene) in Cell
....
Rna() in Cell
P() in Cell
Reactions (8):
Gene + P2 -> P2Gene by k1 * Gene * P2 where k1 := 1
P2Gene -> Gene + P2 by k1r * P2Gene where k1r := 10
....
Gene -> Gene + Rna by k2 * Gene where k2 := 0.01
Rna -> Rna + P by k3 * Rna where k3 := 10
UnitDefinitions (1):
substance := item
>>>
Model の species ID へアクセスするには、みんな大好き apply family の sapply を使う。
<<<
> sapply(species(model(dom)), id)
Gene P2Gene Rna P P2
"Gene" "P2Gene" "Rna" "P" "P2"
>>>
Reactions も同じようにアクセスできる。
<<<
> sapply(reactions(model(dom)), id)
RepressionBinding ReverseRepressionBinding
"RepressionBinding" "ReverseRepressionBinding"
Transcription Translation
"Transcription" "Translation"
Dimerisation Dissociation
"Dimerisation" "Dissociation"
RnaDegradation ProteinDegradation
"RnaDegradation" "ProteinDegradation"
>>>
DOM を Rgraphviz で図示する。rsbml_graph で S4 オブジェクトを graph オブジェクトへ変換できる。あとは graph オブジェクトを操作できるライブラリ、例えば、Rgraphviz などで好きに操作できる。
<<<
> library(graph)
> g <- rsbml_graph(dom)
> g
A graphNEL graph with directed edges
Number of Nodes = 13
Number of Edges = 18
> nodes(g)
[1] "Gene" "P2Gene"
[3] "Rna" "P"
[5] "P2" "RepressionBinding"
[7] "ReverseRepressionBinding" "Transcription"
[9] "Translation" "Dimerisation"
[11] "Dissociation" "RnaDegradation"
[13] "ProteinDegradation"
> library(Rgraphviz)
> g.layout <- layoutGraph(g)
> pdf("autoreg-2-1.pdf")
> graph.par(list(nodes=list(fontsize=30)))
> renderGraph(g.layout)
> dev.off()
>>>
{{image 0, '画像の説明', nil, [500,500]}}
参考URLはここにまとめた。http://b.hatena.ne.jp/ichan/SBML/
コメント
コメントを投稿