一、读取文件,ID转换
1.读取文件
library(clusterProfiler)
library(org.Hs.eg.db)
#读取文件,原始文件中使用空格分割的
go_ythdf2
go_ythdf2
2.ID转换,ENTREZID是进行GO分析最好的ID类型(针对clusterProfiler)
ID转换用到的是bitr()函数,bitr()的使用方法:
bitr(geneID, fromType, toType, OrgDb, drop = TRUE)
geneID:一个含有gene_name的矢量
orgDb:人类的注释包是 org.Hs.eg.db
fromType:输入的gene_name的类型
toType:需要转换成的gene_name的类型,可以是多种类型,用大写character类型向量表示
3.gene_name的类型查看
org.Hs.eg.db包含有多种gene_name的类型
#查看org.Hs.eg.db中可以被选择/使用的类型
keytypes(org.Hs.eg.db)
[1] "ACCNUM" "ALIAS" "ENSEMBL" "ENSEMBLPROT" "ENSEMBLTRANS" "ENTREZID"
[7] "ENZYME" "EVIDENCE" "EVIDENCEALL" "GENENAME" "GO" "GOALL"
[13] "I