项目场景:
KEGG富集图绘制问题
问题描述:
得到差异基因名称,却无法成功绘制富集点状图。
原因分析:
require("clusterProfiler")
require("AnnotationHub")
require("topGO")
require("Rgraphviz")
library(DOSE)
library(org.Hs.eg.db)
#data=read.table("../../diffgene.list",header = F)
data=read.table("../diffgene.list",header = F)
gene<-as.vector(data$V1)
gene_list <- mapIds(org.Hs.eg.db, keys = gene,
column = "ENTREZID", keytype = "SYMBOL" )
kk <- enrichKEGG(gene_list, organism="hsa",
keyType = "ncbi-geneid",
#pvalueCutoff=0.05,
pAdjustMethod="BH",
qvalueCutoff=0.05
)
head(summary(kk))
pdf(file="kegg.enrich.pdf")
dotplot(kk)
此处 enrichKEGG()参数识别的基因名称必须是全部大写,而我们在gtf中提取到的基因名称一般是首字母大写或者全部小写,因此需要处理。
解决方案:
vi diffgene.list
gg gU G #文档全部大写,无需提前输入冒号
#补充 gg gu G 文档全部小写
参考文档:https://www.cnblogs.com/fortran/archive/2010/07/25/1784513.html
结果展示
可以先summary()函数看R的统计结果
使用head()查看前六行数据,没有问题后,再来看看图片。
总结
绘制kegg enrich图一定要保证输入的基因名称是大写格式。