“大数据”、“组学”、“数据挖掘”是近几年来我们经常听到的词汇,科研工作中也经常用到二代测序,不管送哪家测序公司进行测序或数据分析,结题报告中都会看到一个标准的分析套路:功能富集分析。
说起功能富集分析,想必大家并不陌生,但要表述一下它的定义,又很少有人能回答的出(组会的时候,是不是经常会被导师这样Q到呢~~)。
大部分科研工作者,对功能富集分析的最初了解,是从测序公司给我们的分析结果开始的。要知道朦朦胧胧的概念,就会导致对数据结果分析的不透彻,乃至不知如何让测序数据变得有意义。
功能富集分析是什么?GO和KEGG为何物?怎么做功能富集分析才是最准确的?今天,我们就从这几个问题出发,仔细跟大家讲讲功能富集分析的由来、定义,并带领大家进行一个实例操作。
01 何为功能富集分析?功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,