![60bd2ec563413bc339edecd56d4b69cb.png](https://img-blog.csdnimg.cn/img_convert/60bd2ec563413bc339edecd56d4b69cb.png)
上一期我们一起学习了基因芯片数据分析中的GO分析,这一期我们学习KEGG分析。
通路(Pathway)分析包括通路注释和通路富集分析。通路富集分析的基本思路、统计模型等基本和GO富集分析如出一辙。
常用的公共通路数据库主要有KEGG ( Kyoto encyclopedia of genes and genomes)、BioCarta和GenMAPP (Gene map annotator and pathway profiler),最为著名的是KEGG库中的代谢通路,KEGG代谢通路注释几乎成为了通路注释的代名词。
很多事实已经证明,KEGG的数据是非常可靠的,但是我们要注意,KEGG有两个比较大的缺点:第一就是注释源问题,它只提到由相关专家收集整理而成,没有参考文献等来源信息;第二就是授权问题,由于它授权过于严格,Biocondocutor已经无法继续支持它,转而开始使用更加开源的Reactome数据库。
在R语言中KEGG分析主要是由Bioconductor的GeneAnswers包实现的。
接着上一期的代码,我们进行今天的分析。
Bioconductor基因芯片数据分析之GO分析
#安装并加载所需R包。
BiocManager::install("GeneAnswers")library(GeneAnswers)
#选取dif中的三列信息构成新的矩阵,第一列必须是EntrezID
humanGeneInput