关于GSEA的几点补充说明

本文补充了GSEA基因集富集分析中的关键概念,包括核心基因的定义,信号到噪声比,富集得分的统计量以及它们在分析中的作用。还讨论了GSEA软件的局限性,如默认进行的内部差异分析可能不适应所有数据,推荐使用专业差异分析软件计算foldchange值。此外,提到了GSEAPreranked工具作为替代方案,但其仅支持大生物学重复数的参数设置。最后,建议使用其他第三方工具进行自定义排序列表的富集分析。
摘要由CSDN通过智能技术生成

欢迎关注微信公众号《生信修炼手册》!

之前的文章中介绍了GSEA软件的使用和结果解读,但是有几点漏掉了,在本文中补充一下。

首先是Leading Edge对应的3个统计量,示例如下
在这里插入图片描述
在富集结果的表格中,最后一列为LEADING EDGE, 在这一栏中,包含以下3个统计量

  1. tags
  2. list
  3. signal

对于一个基因集而言,定义其中对Enrichment score贡献最大的基因为核心基因,也称之为leading edge subset, 参考下图

在这里插入图片描述
对于Enrichment score为正数的基因集而言,其核心基因是峰值之前的基因,对于Enrichment score为负数的基因集而言,其核心基因是峰值之后的基因。

tags表示核心基因占该基因集基因总数的比例,而list表示核心基因占所有基因总数的比例,signal利用这两个指标计算得到,公式如下
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值