生信学徒一个月,入门抱大腿《生信技能树》,感恩!因为能抽出的时间确实不多,每天晚上挤出一点时间学习生信,所以进度有点慢。现在开始开博记录自己的历程。
今天完成一个作业,其实是应该完成一篇GEO数据挖掘的过程的。因为视频还没看完【捂脸】,所以先把作业交了。
刚入行,才知道Y叔原来是南方医的博导啊!
教程地址:为R包写一本书(像Y叔致敬)。
Jimmy给了处理好的上下调的GeneName的txt文本列表(这里取up列表做分析)。而拿来做KEGG作图的需要ENTREZID,故而需要小小转换一下。hsa人种属转换用org.Hs.eg.db包。代码如下:
library(clusterProfiler)
library(org.Hs.eg.db)
gene_up <- read.table("up_gene.txt")
colnames(gene_up) <- "GeneName"
gene_up_id <- bitr(gene_up$GeneName,
fromType = "SYMBOL",
toType = "ENTREZID",
OrgDb = "org.Hs.eg.db"
)
而后做enrichKEGG分析:
enrichKK <- enrichKEGG(gene = gene_up_id$ENTREZID,
organism = "hsa",
pvalueCutoff = .1,
qvalueCutoff = .1)
不知道为啥有时候等待KEGG的结果很慢。网速?然后看一下enrich出来的是啥东西:
> class(enrichKK)
[1] "enrichResult"
attr(,"package")
[1] "DOSE"
> head(enrichKK)[,1:6]
ID Description GeneRatio BgRatio pvalue p.adjust
hsa04657 hsa04657 IL-17 signaling pathway 7/63 94/7946 8.348006e-06 0.001185417
hsa04310 hsa04310 Wnt signaling pathway 8/63 160/7946 3.430502e-05 0.002435656
hsa05323 hsa05323 Rheumatoid arthritis 6/63 93/7946 8.680682e-05 0.004108856
hsa04060 hsa04060 Cytokine-cytokine receptor interaction 9/63 294/7946 4.689824e-04 0.016105536
hsa05210 hsa05210 Colorectal cancer 5/63 86/7946 5.670963e-04 0.016105536
hsa05213 hsa05213 Endometrial cancer 4/63 58/7946 1.104998e-03 0.023319793
然后居然可以打开网页查看信号通路的图:
> browseKEGG(enrichKK,"hsa04657")
这图实在太丑了!
下面这一步没怎么搞明白。。。
enrichKK = DOSE::setReadable(enrichKK,OrgDb = 'org.Hs.eg.db',keyType = 'ENTREZID')
enrichKK
然后就是画各种图了。
dotplot(enrichKK)
barplot(enrichKK,showCategory = 20)
cnetplot(enrichKK,categorySize="pvalue",foldChange = gene_up_id$ENTREZID,colorEdge = T)
cnetplot(enrichKK,foldChange = gene_up_id$ENTREZID,circular=T,colorEdge=T)
emapplot(enrichKK,pie_scale=1.5,layout = "kk")
上面这图也很丑!而且还看不清,不是很喜欢!
heatplot(enrichKK)