go分析和kegg分析_生信分析中GSEA分析(GO/KEGG富集分析)的重要性

本文介绍了GSEA(基因集富集分析)在生信分析中的重要性,特别是在GO和KEGG富集分析中。GSEA通过预定义的基因集检测基因表达变化,避免单个基因分析的局限性。文章以R语言和clusterProfiler包为例,演示了如何进行GSEA分析,包括基因排序、ID转换和富集分析的步骤,为生信研究者提供了实用的操作指南。
摘要由CSDN通过智能技术生成

各位医学方的朋友,大家好。我是Flyman!

做过下游分析的小伙伴都知道富集分析的重要性,生信类文章大家总会在最后一步针对我们前面筛选出来的差异基因做一下GO/KEGG富集分析,研究一下他们参与到什么信号通路上或者参与什么生物学过程?

富集分析的本质是什么呢?实际上就是一个超几何分布,超几何分布是统计学上一种离散概率分布。它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。基于超几何分布的富集分析,往往侧重于比较两组间的基因表达差异,主要关注少数几个显著上调或下调的基因,这容易遗漏部分差异表达不显著却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息。

那么GSEA是什么呢?GSEA全称为Gene Set Enrichment Analysis,是基因集富集分析,官方解释是使用预定义的基因集(所谓预定义的基因集是指每条通路所含有的基因集合),将基因按照在两类样本中的差异表达程度排序(一般是按照Fold Change排序),然后检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。因此,GSEA分析检测的不是单个基因的表达变化,而是包含那些细微基因的表达变化,从而更为理想的结果。

之前我们医学方已经推出基于GSEA软件的GSEA教程,今天的教程就和聊聊基于R语言实现GSEA的操作。

下面进入正题,基于R语言操作这里使用的是Y叔的R包clusterProfiler:

安装并加载包,关于包的安装,已经讲过多次,直接上代码:

</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值