KEGG Pathway通路二级分类汇总,轻松找到感兴趣的通路

8ea6114c3ef9ad6c8cf4abdc07c56858.jpeg

做完通路富集分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会还真分不清。今天,给大家带来一款实用的KEGG Pathway通路汇总小工具。使用这款工具,我们可以快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等,并最终汇总成一张美图。

汇总原理

KEGG官网页面上给出了所有pathway的名字及其隶属关系,分成三个级别。

一级分类:共7个,分别是Metabolism(代谢)、Genetic Information Processing(遗传信息处理)、Environmental Information Processing(环境信息处理)、Cellular Processes(细胞过程)、Organismal Systems(有机系统)、Human Diseases(人类疾病)和Drug Development(药物开发)。

9c10527ab54e6a642d7792a92ab0ebd3.jpeg

图1. 一级分类

二级分类:在一级分类下面的分类,例如一级分类Cellular Processes下面包括5个二级分类:Transport and catabolism、Cell growth and death、Cellular community – eukaryotes、Cellular community – eukaryotes和Cell motility。

三级分类:二级分类下面的分类,例如二级分类Cell motility下面包括3个三级分类:Bacterial chemotaxis、Flagellar assembly和Regulation of actin cytoskeleton。

我们富集分析的结果一般都是三级分类,因此使用二级分类对三级分类进行汇总,可以快速找到相关的通路。例如Cell growth and death(细胞生长与死亡)相关通路。

2ad954339f31cdc8d7df24030cf7a831.jpeg

图2. 一、二、三级分类

1,打开绘图页面

首先,使用浏览器(推荐chrome或者edge)打开KEGG Pathway二级分类汇总绘制页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在搜索框中搜索pathway,找到绘图页面。

http://www.bioinformatics.com.cn/plot_basic_pathway_enrichment_second_class_summary_bar_plot_206

7bf0ac4fdb39ed6db3b382ca39ef5dd3.jpeg

图3.可视化绘图页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

1bd20f91bb820dfcaaa73b1bc534f511.jpeg

图4. 输入数据示例

示例数据(仅供参考)包括两列:

第一列是富集的pathway通路名字;

第二列是【该富集通路中包含的基因】与【做富集分析时所输入的基因】的交集基因个数。

3,粘贴示例数据

直接拷贝示例数据中的AB两列数据,然后粘贴到输入框。

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。同时数据矩阵中不能有空的单元格,中文字符等。

f5e14258718ab9e43eb828f95bbd29d8.jpeg

图5. 必需输入

4,修改参数,并提交

我们设置了图片尺寸、文字大小、颜色、字体等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。

293ecfcb0041c56b7d122b2d6d304afc.jpeg

图6.颜色、字体等可调参数

5,提交出图

粘贴好输入数据,调整好参数(重点是X轴最大值的参数)后,点击提交按钮,几秒钟后,会在页面右侧出现预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png),及汇总表格。

03b592f3828b8236ebfb9e649f38ca2c.jpeg

图7.预览与下载

结果说明

1)图中左侧黑色粗体为一级分类名,共6个(去掉了Drug Development),其余为二级分类名,同一级别的名字用相同颜色显示。右侧条形为隶属于该分类的基因数之和,可以很方便地看出二级分类名字及基因数。

2)由于不同的富集工具使用的名字略有不同,因此若存在与KEGG官网不一致的名字,请根据提示,调整后重新提交作图。

3)我们还提供了带有一级、二级及三级分类的汇总结果表格供下载。表格形式见图8。

293759c1e95426cec14fac268a5ad9d1.jpeg                                                            图8.汇总结果表格

没有预览就是没有出图,这时请参考示例数据,检查输入数据的格式。

遇到文字截断,需要修改字体、调整字体大小等,请参考科研作图实操:用inkscape编辑svg矢量图

微生信助力高分文章,用户55000+,引用700

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GO信号通路富集是一种基于基因功能注释的方法,可以帮助研究人员了解基因集合中不同信号通路的富集情况。它基于Gene Ontology(GO)数据库中定义的术语,将基因按照其生物学功能进行分类和注释。 GO信号通路富集分析通常通过比较研究人员关注的基因集合与背景基因集合之间的差异来进行。背景基因集合通常是整个基因组,而关注的基因集合通常是与特定生物学过程相关的基因集合,例如在疾病状态下的差异表达基因。通过进行统计分析,可以确定哪些GO信号通路在关注的基因集合中富集得更多。 KEGG信号通路富集是一种基于KEGG数据库的方法,用于分析与不同生物学过程相关的基因集合。KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是一个关于生物化学途径和功能注释的综合数据库。 KEGG信号通路富集分析通常通过匹配研究人员关注的基因集合与KEGG数据库中的信号通路,来确定哪些信号通路在这个基因集合中富集得更多。通过进行统计分析,可以判断哪些KEGG信号通路在关注的基因集合中具有显著的富集程度。 总结来说,GO和KEGG信号通路富集分析是两种常用的方法,用于鉴定基因集合中与特定生物学过程相关的信号通路的富集程度。这些方法可以帮助研究人员更好地理解基因功能和基因调控的机制,为进一步的生物学研究提供重要参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值