2Y叔的clusterProfiler-book阅读Chapter 2 Functional Enrichment Analysis Methods

第二章Chapter 2 Functional Enrichment Analysis Methods
2.1DEG后的基因富集分析
Y叔讲到DEG后的基因富集分析,p值的通过超几何分布计算出来的
在这里插入图片描述
其中N是背景分布中基因的总数目(即差异基因的数目),M是注释到目标基因集的基因数目,n是目标基因集的大小,k是注释到基因集列表中的基因数目。
默认情况下,背景部分是所有具有注释的基因,可以通过多重比较调整P值。
在这里插入图片描述
Fisher检验
在这里插入图片描述

2.2GSEA进行基因富集分析
通过基因的差异表达的话,只能检测到差异的基因在基因集中的分布,而对于差异小的基因,这种富集情况却被忽略了。而GSEA分析,拿全部的基因进行分析,背景基因是探针检测到的全部基因

GSEA分析这种分析将变化微小的基因,以及在差异阈值以下的基因均包含在目标基因集了,因此相比于DEG后的数据进行分析,其更具代表性,说服力更好。GSEA中,差异微小,但是与表型相关的基因,表化趋势一致,也能表明其在功能上的作用。

基因通过表型进行排序,给定先验定义的一组基因S,GESA的目的是确定S基因集中的成员是随机分布在基因列表的顶部还是底部。

对于GSEA分析中最重要的几个元素是
1.富集分数(enrichment score)
富集分数是表示集合S在排名列表L的底部或者顶部过表达的程度,这个得分按照基因列表L排序逐步降低的方式得来的。当在列表L中遇到基因集S中的基因时,这个得分就被累积,当在列表L中遇不到基因集S中的基因时,得分就降低。得分的增量,取决于基因统计(基因与表型的相关性)

2.ES显著性的模拟(Esimation of Significance Level of ES)
使用置换检验ES的p值,具体就是置换掉列表L中的基因的标签,并用置换后的基因进行ES分析,这就产生了ES的零分布,然后相对于这个零分布计算观察到的ES的p值。

3.多重假设检验的调整(Adjustment for Multiple Hypothesis Testing)
当评估富集基因集的时候,使用DOSE调整估计的显著性水平,用以考虑多重假设检验,并且还为FDR对照计算的q值。

DOSE算法于2015被Y叔提出,用户可以通过在DOSE参数中指定by="fgsea"或者DOSE来快速进行GSEA分析。默认情况下,DOSE使用fgsea,因为后者更快。

2.3(前沿分析和核心富集分析)Leading edge analysis and core enriched genes
前沿分析报告中,标记以指示有助于富集得分的基因的百分比,列表用以指示在列表中获得的富集的位置以及指示富集信号的强度。

获得富集的核心富集的基因集也是非常重要的。
DOSE支持前沿分析并在GSEA分析中报告核心富集基因。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值