gsea富集分析结果怎么看_豆豆学习GSEA

本文介绍了GSEA(Gene Set Enrichment Analysis)的基本原理和两种分析方法,包括R语言实现和使用GSEA软件。GSEA不同于传统的差异分析,它不设阈值,而是通过排序基因列表来检验基因集的富集情况,适用于功能注释和通路分析。文章还提到了GSEA的参数设置和结果解读。
摘要由CSDN通过智能技术生成

8b731e4a91caa7524e18590a1e05861a.png2965282495899b72950b868c85ce1c4e.png 今天是生信星球陪你的第521天8b731e4a91caa7524e18590a1e05861a.png


   大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~

   就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~

   这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!

豆豆写于2020.1.22-23
自从上次写过豆豆在UM的第一天 就开始了适应过程,到现在也适应差不多了,一切步入正轨,赶在过年之前发一波

我们经常听说:Gene Set Enrichment Analysis、GSEA、基因集富集分析,这三种实际上都是描述的一种方法,就是寻找基因的功能大概是什么样子的。
这一次,就来认识一下GSEA吧

以往的认知

我们经常做转录组分析,于是最熟悉的是:差异分析 + 功能注释。经常设定一个logFC阈值,然后找变化倍数大于或者小于这个值的基因,作为上调或者下调。而这个阈值的设定,经常没有一个标准,主观性很大,但有时也会添加一点统计知识进去,比如利用mean + 2sd来计算这个阈值。

最后会利用这些差异基因,来进行GO或者KEGG的注释,找到它们主要在哪些通路富集,从而提供一些思路。

那么以上?的思路就属于:过表征分析(ORA, Over-Representation Analysis),属于初步探索。

当然其中也会有一些问题,例如:

  • 只分析差异基因,但表达真的只受那些变化大的基因影响吗?

  • 我们设置的logFC靠谱吗?不同的logFC得到的差异基因数量不同,那么再进行富集分析的结果又有多少重合呢?

  • 找差异基因的过程往往假设基因间是相互独立的,但实际上许多基因的关系还是很密切的

  • 另外即使两个基因都被分在了上调基因组,一个FC是8,一个FC是4,那么能认为这两个基因的特征是一样的吗?

  • 如果现在有两个实验组,都分别找到了差异基因,现在想通过找它们共同的差异基因,然后做富集分析。但是,结果可能是:两个组的差异基因数量本身很多,它们的交集很少(比如才二三十个),这样再向下做差异分析就很困难

之前也介绍过相关的内容,见:富集分析Enrich Me! 、富集分析Enrich me again!

GSEA就是属于第二代方法:FCS(Functional Class Scoring)的范畴

基本上能看到类似的这种图就说明是用GSEA做的:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值