基因id转换

哎,建立酶约束代谢模型,中途莫名其妙报错,一行行运源码,查看中间变量,发现是基因id格式的问题,于是打算换格式。

一开始打算用网页转换,但它把我的顺序搞乱了,并且很多都显示none,但我在ncbi上是能查到的。后面打算用R语言转,但是bitr函数有不准确性,于是选择用AnnotationDbi包的mapIds函数实现转换。

用install.packages("AnnotationDbi")无法安装,于是先装BiocManager,再用下面的代码安装:

BiocManager::install('DBI')
BiocManager::install("AnnotationDbi")
BiocManager::install('org.Hs.eg.db')

后面发现excel文件读取太麻烦了,于是把初始数据存为了csv文件,使用read.table函数读取,其返回结果为data.frame:

aih <- read.table(file='F:/MathWorks/Projects/ecHuman/data/aih.csv', header=TRUE, sep=",")
head(aih)

输出结果:

然后提取第一列作为字符向量(因为后面mapIds函数要求keys是字符向量)

ddj=aih[['Gene.Names..primary.']]
typeof(ddj)
head(ddj)

输出结果:

最后转换id,并将结果输出为csv文件:

library(org.Hs.eg.db)
library(AnnotationDbi)
xdl=c()
for (i in 1:20420) {
  xdl[i]<-mapIds(x = org.Hs.eg.db,keys = ddj[i],column = "ENSEMBL",keytype = "SYMBOL")
}
aih$Gene.Names..primary.<- xdl
write.csv(aih, "aih.csv ")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值