欢迎关注微信公众号《生信修炼手册》!
Gene Set Enrichment Analysis是一种富集算法,由Broad Institute研究所的科学家提出,算法核心示意如下
需要两个输入元素,一个就是排序好的基因列表,这里的排序的规则是展现两组间的差异,比如按照Foldchange的值进行排序,第二个就是基因的注释集合,然后运行KS检验计算Enrichment Score(ES),用置换检验评估ES的可行度,
Broad Institute研究所的科学同时还提供对应的分析软件GSEA
,该软件是java语言开发的图形界面软件,简单易用,下载地址如下
官网提供了多种下载方式,推荐直接下载jar文件,示意图如下
如下所示,运行GSEA分析,需要两个基本元素,第一个就是表达谱数据,可以是芯片数据,也可以是rna-seq的定量结果,第二个就是基因集数据库,官网对于human提供