前两期期我们一起学习了基因芯片数据分析中的GO分析和KEGG分析,这一期我们来学习基因芯片数据分析中的可视化。
可视化可以直观显示统计结果,帮助我们进一步理解实验结果,同时找到下一步工作的思路,因此可视化和统计分析密不可分。
Bioconductor 的所有统计分析包几乎都提供了相应的函数来显示数据分析结果。
这里根据前面两期的分析结果,调用pheatmap包来绘制差异表达谱热图;调用Rgraphviz包来绘制显著富集的GO term的关系图;最后绘制显著富集的KEGG通路的关系图和热图。
接着上一期的代码,我们进行今天的分析。
Bioconductor基因芯片数据分析之KEGG分析
#安装并加载所需R包。
BiocManager::install("pheatmap")library(pheatmap)
#从基因表达矩阵中,选取差异表达基因对应的数据
selected
#将selected矩阵每行的名称由探针组ID转换为对应的基因symbol
rownames(selected) < dif$symbols
#考虑到显示比例,我们只画前20个基因的热图
pheatmap(selected[1:20,],color = colorRampPalette(c("green