######################entrezID转换##################################
#############教程:B站不吃糖的康康《ensembl_ID转换》################
library(org.Hs.eg.db)
keytypes(org.Hs.eg.db)#####查看org.Hs.eg.db中可以被选择/使用的类型
setwd("C:/Users/HUAWEI/Desktop/Rdata/bss/GSEA")
gsea <- read.csv("gsea.csv",header=T)
X <- gsea$ensembleID######第一列就是ensembleID,把他赋值给一个X
get <- c("SYMBOL","GENENAME","ENTREZID")
result <- select(org.Hs.eg.db,
keys = X,
columns = get,
keytype = "ENSEMBL")
###select选择一个函数(org函数)
####keys=x是表示数据来源(来源于x,x是刚刚赋值的gsea$ensembleID)
###column是需要获得的类型(需要获得get,get <- c("SYMBOL","GENENAME""ENTREZID")
###keytype是输入的类型(ENSEMBL)
#####【'select()' returned 1:many mapping between keys and columns】不是一一映射的,是有重合的。
result <- na.omit(result)###去除result里面的NA值(有些在org包里匹配不到的)
table(duplicated(result$ENTREZID))#####有重复,原因是好几个探针覆盖同一个基因。可以看一下多少重复。
让我们谢谢b站~~~~!
感谢bilibili大学。