基因功能的富集分析已成为高通量组学数据分析的常规手段,对于揭示生物医学分子机制具有重要意义。关于GO、KEGG、GSEA等等这些词,网上也有很多教程,教大家怎么做GO分析、怎么做GSEA分析等等。但我们不仅要知其然,还要知其所以然。这里,我找到两篇富集分析的综述,跟大家一起学习一下。
照例,先给出这两篇文章
Ten Years of Pathway Analysis: Current Approaches and Outstanding Challenges
基因功能富集分析的研究进展
一、为什么要进行功能富集分析?
随着高通量技术的发展,生物医学相关研究领域进入了组学时代,单个基因的研究已经不能满足研究人员的需要。然而,如此庞大的数据使得信息的有效提取和分析带来了新的挑战。以测序数据为例,测序结果分析往往会得到差异表达的基因或蛋白列表。但对许多研究人员来说,将这一长串基因或蛋白与某个待研究的生物学现象及其潜在机制联系起来是很困难的。应对这一挑战的一种方法就是将一个基因或者蛋白列表分成多个部分,从而减少分析的复杂度。研究人员为了解决分成哪些类,开发了多个注释数据库。为了解决怎么分成不同类,研究者通常会对基因功能进行富集分析, 期望发现在生物学过程中起关键作用的生物通路, 从而揭示和理解生物学过程的基本分子机制,在这过程中开发了多种软件。
功能富集分析可以将成百上千个基因、蛋白或者其他分子分到不同的通路中,以减少分析的复杂度。另外,在两种不同实验条件下,激活的通路显然比简单的基因或蛋白列表更有说服力。