R语言GeneID转换

ENSG-GeneSymbol-GeneID转换

读取数据

##read.delim()函数读取tsv数据
exp <- read.delim("TCGA-BRCA.htseq_counts.tsv",stringsAsFactors=FALSE) 
data=data.frame(exp)

基因ID转换

library(stringi)##加载包
data$Ensembl_ID=stri_sub(data$Ensembl_ID,1,15)##保留前15位

# 加载相关包
library(clusterProfiler)
library(org.Hs.eg.db)

# 查看org.Hs.eg.db 包提供的转换类型
keytypes(org.Hs.eg.db)

# 需要转换的Ensembl_ID
Ensembl_ID <- data$Ensembl_ID

# 采用bitr()函数进行转换
gene_symbol <- bitr(Ensembl_ID, fromType="ENSEMBL", toType=c("SYMBOL", "ENTREZID"), OrgDb="org.Hs.eg.db")

# 查看转换的结果
head(gene_symbol)

#匹配到表达矩阵中
data=data.frame(gene_symbol,data[match(gene_symbol$ENSEMBL,data$Ensembl_ID),])

#去除重复的Ensembl_ID列
data=data[,-4]

  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值