gsea富集分析结果怎么看_无需写代码的高颜值富集分析神器

无需写代码的高颜值富集分析神器

富集分析是了解一个基因集功能倾向性的一个方式,在组学研究领域应用广泛。常见的有基于差异基因的Over-representation分析,也就是常说的GO、KEGG富集分析和Functional class scoring分析,如GSEA。这两种富集分析算法不同,但可以都支持同样的注释集,如GO、KEGG或其他类型的注释。基本原则只有一个:基因集的基因名字与注释集的基因名字能匹配。剩下的就是了解下原理去操作了。

下面三篇文章建议仔细多读几遍,尤其是原理解释部分。对以后的分析事半功倍。做了一年的培训的体验是:学不会是因为没时间。时间用到了,自然就会了,培训现场的进度就是最好的支持证据。我们的培训希望在3天时间告诉大家需要3个月到半年可以掌握的知识,多读几遍也就都会了 (跑题了)。

  • GO、GSEA富集分析一网打进
  • GSEA富集分析 - 界面操作
  • 去东方,最好用的在线GO富集分析工具

今天给大家介绍的是Cytoscape的插件??ClueGO。ClueGO能以网络图的形式来展示GO富集结果。

除了在线工具和R代码,今天带来的是网络绘制工具Cytoscape的一个插件ClueGO,支持200多个物种,支持数据库实时更新,支持多个注释数据集,支持多集合富集结果比较和网络图展示。配合Cytoscape的网络操作,可以做更多探索。下面看看怎么安装和使用吧。

ClueGO安装

官网下载

(http://apps.cytoscape.org/apps/cluego)

ce365ccf198ae353a6bef9aa904e3a00.png

2.Cytoscape的APP Manager中下载

3f16675d8ac9daf8b87825360dece7c3.png

1713824662d4e5e6a397a2e08af6a1f4.png

ClueGO激活

ClueGO第一次使用需要按照提示申请license,申请网址为:http://www.ici.upmc.fr/cluego/cluegoLicense.shtml。 点击Request a license key,填写基本信息之后提交审核,审核时间可能需要几天。拿到license之后点击App-ClueGO,在弹出的提示框中输入license即可激活ClueGO。

简单使用ClueGO

1. 上传数据

可以粘贴基因的idsymbol等或从本地上传文件 (富集分析的基因集只需要基因名字),我们以ClueGO的示例文件“CluePediaExampleFile_Th1RelatedGenes.txt”为例,并选择其对应物种和自动识别Gene id类型选项。

619fef45cc0311a99a31b606a235f93a.png

2. 选择富集数据集和富集标准

默认是BP,我们增加选择了CC和MF。同时可以在右侧选择不同支持度的注释,实验支持的、人工校对的还是计算预测的等。GO中的IEA数据为电子注释结果。如果物种注释的好,如模式生物,可以比较下有无IEA对富集结果的影响。

370b914f004fa00299e99e92a899ba1b.png

然后勾选以下选项,目的是只显示p值<=0.05的富集结果。具体选择的富集显著性Pvalue,可自行调整。

9f6cef4019b95424760c1e46021b04b7.png

3. 富集分析和结果展示

点击start开始进行富集分析

e7c35f4cf610c8a97fa4bf0e31042c33.png

运行结束后,会跳出一个简述富集结果信息的提示框,包括物种, 基因名字匹配的注释信息重叠度冗余度等信息。

792aa630608038634d3149dc8039e08d.png

Cytoscape的网络视图中展示的是富集结果的网络图。每个节点为代表性富集通路,节点的连线代表通路之间的共有的基因数,颜色代表该节点的富集情况分类(隶属于哪个功能组,颜色和表格形式的的ClueGO结果对应)。

63d7ab5a37cf70ad92f81c9984060c18.png

4. 结果导出矢量图和表格

结果导出为矢量图

7f8abad6ff86e68a1aa0d9be272bb659.png

结果保存为表格或Excel格式

482382cae39baf85641fcb965c34e48b.png

ClueGO优势

1. 物种丰富,并支持手动下载

本地有人类和小鼠可选,也可根据需要下载,支持近200个物种。

6c496d0edbb3fcc279fbe241885c5f27.png

2. 物种注释手动更新

83f67cd888c8fa812c0c7e91dcb752c2.png

(前面推荐的GOEAST是每周更新,这个可以认为是实时更新。R中的注释包相比来说更新的慢了些,需要社区发布新版本或自己整理。)

3. 多种网络布局和自由网络设计

网络布局类型选择

21e94720486836db8d2a93834f866515.png

style选项可对网络的颜色,节点,网络等进行修改。还可以映射其它如表达量信息等。

6bdf6061612f71f14b2790f50f2f677c.png

4. 多个数据集比较

同时导入2组或多组基因列表,可以进行比较分析。

22bb9c72e601205558c739a322a8cedf.png

富集结果

信息概括

1877b2d07003092518e05c060474d77b.png

网络图和详细信息

13ce50010ebfb0ee4740d219cf0bb9d8.png

006f18f9666adf23ebbd732ff988bad8.png

5. 链接外源数据库

看到感兴趣的基因、通路,可以直接选择需要的外源数据库查询获得更多信息。

cfe483c27932937428a3bf41b0dc59f2.png

更多Cytoscape的使用

  • Cytoscape教程1
  • Cytoscape之操作界面介绍
  • 新出炉的Cytoscape视频教程
  • Cytoscape制作带bar图和pie图节点的网络图
  • Cytoscape: MCODE增强包的网络模块化分析
  • 生信宝典之傻瓜式 (五) 文献挖掘查找指定基因调控网络
没钱买KEGG怎么办?REACTOME开源通路更强大​mp.weixin.qq.com
c05cc535bfaeab5d755a38ae2d04f7b2.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一份使用R语言进行GSEA分析的示例代码,供参考: ```{r} # 导入所需的R包 library(ggplot2) library(fgsea) library(org.Hs.eg.db) # 读取数据和基因注释信息 data <- read.table("data.txt", header = TRUE, row.names = 1) gene_symbols <- rownames(data) gene_entrez_ids <- mapIds(org.Hs.eg.db, gene_symbols, "ENTREZID", "SYMBOL") # 将数据按照基因表达水平从高到低排序 data_sorted <- data[order(rowMeans(data), decreasing = TRUE), ] # 定义高低风险组 high_risk_samples <- c("sample1", "sample2", "sample3") low_risk_samples <- c("sample4", "sample5", "sample6") # 计算高低风险组的基因表达平均 high_risk_mean <- rowMeans(data_sorted[, high_risk_samples]) low_risk_mean <- rowMeans(data_sorted[, low_risk_samples]) # 计算基因表达差异 diff_expression <- high_risk_mean - low_risk_mean # 进行GSEA分析 gene_sets <- read.gmt("gene_sets.gmt") fgsea_res <- fgsea(gene_sets, diff_expression, nperm = 10000) # 绘制富集分析结果图 enrichment_plot <- ggplot(fgsea_res, aes(x = pathway, y = NES, fill = pval)) + geom_bar(stat = "identity", alpha = 0.8) + scale_fill_gradient(low = "blue", high = "red") + theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1)) + labs(x = "Pathway", y = "Normalized Enrichment Score (NES)", fill = "Adjusted p-value") enrichment_plot ``` 其中,`data.txt`是包含肿瘤样本基因表达数据的文件,`gene_sets.gmt`是包含基因集的GMT格式文件。在上述代码中,我们首先读取并排序基因表达数据,然后定义高低风险组,并计算基因表达差异。接着,我们使用`fgsea`函数进行GSEA分析,并绘制结果图。在绘制图表时,我们使用`ggplot2`包进行可视化,将富集分析结果按照`NES`和`adjusted p-value`进行着色。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值