1、功能富集分析
随着高通量技术的发展,生物医学相关研究领域进入了组学时代,单个基因的研究已经不能满足研究人员的需要。然而,如此庞大的数据使得信息的有效提取和分析带来了新的挑战。以测序数据为例,测序结果分析往往会得到差异表达的基因或蛋白列表。但将这一长串基因或蛋白与某个待研究的生物学现象及其潜在机制联系起来是很困难的。应对这一挑战的一种方法就是将一个基因或者蛋白列表分成多个部分,从而减少分析的复杂度。为了解决分成哪些类,开发了多个注释数据库。为了解决怎么分成不同类,研究者通常会对基因功能进行富集分析, 期望发现在生物学过程中起关键作用的生物通路, 从而揭示和理解生物学过程的基本分子机制。
功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。
2、GO富集分析
GO是Gene Ontology的简称,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。
3、KEGG 富集分析
KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库。,大多数听说过KEGG的人都会把它当做一个基因通路(Pathway)的数据库,其实人家的功能远不止于此。KEGG该数据库有助于把基因及表达信息作为一个整体的网络进行研究。KEGG整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(PATHWAY)、药物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因组(GENOME)等。
4、DAVID富集分析
DAVID (the Database for Annotation,Visualization and Integrated Discovery)的网址是(https://david.ncifcrf.gov/)。 DAVID是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。
D