哎,建立酶约束代谢模型,中途莫名其妙报错,一行行运源码,查看中间变量,发现是基因id格式的问题,于是打算换格式。
一开始打算用网页转换,但它把我的顺序搞乱了,并且很多都显示none,但我在ncbi上是能查到的。后面打算用R语言转,但是bitr函数有不准确性,于是选择用AnnotationDbi包的mapIds函数实现转换。
用install.packages("AnnotationDbi")无法安装,于是先装BiocManager,再用下面的代码安装:
BiocManager::install('DBI')
BiocManager::install("AnnotationDbi")
BiocManager::install('org.Hs.eg.db')
后面发现excel文件读取太麻烦了,于是把初始数据存为了csv文件,使用read.table函数读取,其返回结果为data.frame:
aih <- read.table(file='F:/MathWorks/Projects/ecHuman/data/aih.csv', header=TRUE, sep=",")
head(aih)
输出结果:
然后提取第一列作为字符向量(因为后面mapIds函数要求keys是字符向量)
ddj=aih[['Gene.Names..primary.']]
typeof(ddj)
head(ddj)
输出结果:
最后转换id,并将结果输出为csv文件:
library(org.Hs.eg.db)
library(AnnotationDbi)
xdl=c()
for (i in 1:20420) {
xdl[i]<-mapIds(x = org.Hs.eg.db,keys = ddj[i],column = "ENSEMBL",keytype = "SYMBOL")
}
aih$Gene.Names..primary.<- xdl
write.csv(aih, "aih.csv ")