gsea富集分析结果怎么看_“个性化”GSEA分析 Do GSEA with specified gene set

15110338c373aec227adc9829488a959.gif

在上次的GSEA教程(“便携式”GSEA分析 - Do GSEA without "GSEA software" )中,我们给大家演示了如何跳过官方的GSEA软件,直接用R语言进行GSEA分析,非常方便快捷。在上次教程的最后,我们给大家提了一个问题:如何对某些特定的基因进行GSEA富集分析?比如,免疫相关的基因,肿瘤相关的基因等等。换句话说,我们在用GSEA做富集分析时,如何选择自己感兴趣的特定基因集合,这是一个非常实用的问题。比如我们研究的是肿瘤,那我们自然不想对不相关的通路进行富集,否则可能对我们的最终结果产生混淆。如果我们恰好对某一些通路感触颇深,或者就只想看看某几条通路是否在两个组别中有变化,那么接下来的操作会对大家有所帮助。本章内容,我们就来跟大家讲解,如何利用特定基因集进行GSEA分析。

首先,让我们再简单回顾下GSEA的操作过程,(1)我们需要按顺序排列好的gene list用于分析,(2)需要参考基因集pre-defined gene set,那么这个从哪里来呢?这么跟大家说吧,在GSEA中富集出来的基因功能类或者基因集合都是提前定义好的,谁定义的呢?当然是GSEA官方或者一些权威数据库(比如KEGG通路数据库,Gene Ontology数据库等)。举个例子,有哪些基因隶属于p53 signaling pathway或者MAPK singaling pathway是不需要我们操心的,有专家已经帮我们定义好了。那么,如何去查看或者下载这些预定义好的基因集合呢?打开如下链接:

  • https://www.gsea-msigdb.org/gsea/index.jsp

7efb90cffa7f1c5f3304150c690fca49.png

上面就是GSEA的官方网站的主页,如何找到我们感兴趣的基因集呢?如下图操作,找到MsigDB(Molecular Signatures Databases),这里面包含了GSEA定义的所有基因集,分为八个大类,分别由“H"和“C1”-“C7”开头,每个大类中都包含了哪些基因集在网页中有详细解释。比如C6是肿瘤相关,C7是免疫相关。

a9b9cf727c2bff09d53ba635697338d4.png

点击进去之后,有每个部分的详细描述,我们可以根据自己的需求选择特定的基因集。

d49095e6b876bf3e8a65f8283059e33a.png

这里我们选择Hallmark gene set作为示例,通过其官方定义,我们知道该基因集是通过共表达模式定义了50个特定生物学过程或状态。为了将其用于后续的分析,我们可以将其下载下来。点击下图红色框中的链接即可下载gmt格式的基因集。

086681d071e831a9095b79ff9e15a7aa.png

这个gmt文件里面是什么内容呢?我们可以把它用Excel表格打开看一眼。可以看到这个文件中每一行是一个基因集,第一列是基因集的名字,第二列是官网链接,后面的所有列就是该集合中包含的基因了(当然,这里是基因的Entrez ID)。

4de8827a5751129c672be84722a2a804.png

实例演练

现在给大家演示如何用特定的.gmt文件(基因集合)进行GSEA分析,我们还是用上次的数据集(没有测试数据的同学,可以在文末联系客服小姐姐领取)。我们先讲第一种方法:还是使用clusterProfiler包进行分析,代码如下,在计算出来的结果中,我们可以选择前10个富集出来结果绘制气泡图,同时选择第一个基因集合INTERFERON GAMMA RESPONSE绘制gsea图:

1#clusterprofiler2pathway"h.all.v7.0.entrez.gmt")
3y 4dotplot(y,showCategory=10)
5gseaplot2(y,"HALLMARK_INTERFERON_GAMMA_RESPONSE",color = "red",pvalue_table = T)

8e3abb5858daa7216da47132cafabdc7.png

fa93d52f31fcb783338b0a662135ef32.png

如果你看倦了气泡图和GSEA图,在这里我们也给大家提供了另外一种方式,通过fgsea包选择特定基因集合进行分析,代码如下:

1#fgsea2pathways"h.all.v7.0.entrez.gmt")
3fgseaRes 1000,minSize=15, maxSize=500)
4topPathwaysUp  0][head(order(pval), n=10), pathway]
5plot.new()
6plotGseaTable(pathways[topPathwaysUp], gene, fgseaRes, gseaParam=0.5)

绘制出来的图形和结果如下所示,个人认为这种结果看上去更加简洁明了,我们最关心的NES、p value、adjusted p value以及Gene Ranks的缩略图都在图表中了。

9f8fd4c4e11d19926e45650c2f73a18e.png

好了,关于定制化的万能GSEA分析到这里告一段落,对于我们上次教程提出的问题,如果你想做免疫相关通路的GSEA,现在可以动手尝试起来喽。最后回顾一下,既然通路是由基因集组成的,我们自然可以选择我们想要研究的通路进行富集,同样那么在我们遇到一些崭新问题的时候,是不是也可以自己“制作”参考基因集呢?

本期教程,关于通过R语言进行GSEA分析,我们讲到这里,需要完整代码的同学,关注“科研猫”,联系文末客服领取。

本期干货

·

- 个性化GSEA分析 -

关注“科研猫”公众号,联系客服

胖雨小姐姐

or

折耳猫小姐姐

领取

9992c9a99a53747a86b0e3daf4573377.png

更多科研新鲜资讯、文献精读和生物信息技能

请关注科研猫公众号

7b9d678dc9f120b70035fb03d32662d1.png

未经许可请勿随意转载,

版权事宜由上海辰明律师事务所提供法务支持

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值