左右双侧条形图展示基因本体论(GO)BP、CC、MF三合一富集分析结果C、MF三合一富集分析结果

基因本体论(Gene Ontology,GO)计划(http://www.geneontology.org)为注释基因、基因产物和序列开发了一套结构化的、受控词汇表。它被分成三部分:分子功能(Molecular Function,MF)、生物过程(Biological Process,BP)和细胞组分(Cell Component,CC)。

GO功能富集分析结果,一般都会包含至少4列:GO term,基因数,P值和类别。今天给大家带来一张非常直观,颜值也颇高的GO富集结果可视化图。

5c7e6d4cdf307996750893236afe5fc4.jpeg


1,打开绘图页面

首先,使用浏览器(推荐chrome或者edge)打开GO BP、CC、MF三合一双侧条形图绘制页面,左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。

http://www.bioinformatics.com.cn/plot_basic_GO_term_bp_cc_mf_left_right_bar_plot_191

1411fc53cd1f63d640c6119cf36ee7de.jpeg

1.可视化页面


2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

示例数据(仅供参考)包括4列:

第1列是GO term名字;

第2列是分类(分类名必需是Biological process、Cellular component、Molecular function,且按照顺序排列);

第3列是Pvalue(或者FDR、qvalue等,程序会默认自动将其转化成-log10值,因此p值不能为0),每个类别之内的条目可以按照P值从小到大,或者从大到小排列;

第4列是基因数;

注意:你需要参考示例数据,将自己的富集结果在excel中整理成示例数据的样式。

b545991cf1426c063a670dc2e7e79ee3.jpeg

2. 输入数据示例


3,粘贴示例数据

直接复制示例数据中的ABCD 4列数据,然后粘贴到输入框。

注意:不是拷贝excel文件,是拷贝excel文件里边的数据哦。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。并且数据矩阵中不能有空的单元格,中文字符等。

7953e7874ff2c798d686f8c013981436.jpeg

3. 必需输入


4,修改参数,并提交

我们设置了图片尺寸,颜色等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。


部分参数详解:

颜色:这里我们还是使用Nature Publishing Group的配色。

左侧最大值:用来控制左侧的柱子距离左边界的距离,请使用可整除的整数

右侧最大值:用来控制右侧的柱子距离右边界的距离,请使用可整除的整数

这两个值需要与图片长宽配合着使用,以保证零点位置不是0.0。

c57e3c58a653b9a370c592fd6b850c86.jpeg

4. 颜色等可调参数


5,提交出图

输入数据粘贴好,参数调整好后,点击提交按钮,约3秒后,在页面右侧会出现结果预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png)。


图左侧表示GO term的统计p值(-log10转化),p值越小,条形越长;并且按照颜色区分三部分;

图右侧表示富集的基因数,基因数越多,条形越长。


点评:与气泡图相比,该图的优点在于一眼就能分辨出那个term的基因数最多,P值最小。因为人们对于颜色的分辨程度要低于对尺寸的分辨程度,特别是在颜色差别不大的情况下。

ce165feb27513bd65261e20c4552dc46.jpeg

5.预览与下载


没有预览就是没有出图,这时请参考示例数据,检查输入数据格式。

遇到文字截断,需要修改字体、调整字体大小等,使用scape软件



  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,我可以为您提供一些R语言代码来实现您提到的分析和绘图步骤,具体如下: 1. 首先,您需要安装一些必要的R包,例如DESeq2、clusterProfiler等等。您可以使用以下命令进行安装: ```R install.packages(c("DESeq2", "clusterProfiler")) ``` 2. 接下来,您需要读取差异表达分析结果。这里我们使用DESeq2作为例子,您可以根据您使用的分析工具来进行相应的修改。假设您的分析结果存储在一个名为`DESeq2_result.csv`的文件中,您可以使用以下命令进行读取: ```R library(DESeq2) result <- read.csv("DESeq2_result.csv", header=TRUE, row.names=1) ``` 3. 然后,您可以根据您的设定,选择出上调基因和下调基因。这里我们以p值小于0.05作为显著性阈值,以log2(fold change)大于1作为上调基因筛选条件,以log2(fold change)小于-1作为下调基因筛选条件。您可以使用以下代码进行选择: ```R sig_genes <- subset(result, padj<0.05) up_genes <- subset(sig_genes, log2FoldChange>1) down_genes <- subset(sig_genes, log2FoldChange<(-1)) ``` 4. 接下来,您可以使用clusterProfiler包中的enrichGO函数进行GO富集分析。这里我们以对上调基因进行富集分析为例,您可以根据需要进行修改。假设您的基因ID存储在一个名为`gene_id`的向量中,您可以使用以下代码进行富集分析: ```R library(clusterProfiler) gene_list <- up_genes$gene_id ego <- enrichGO(gene_list, OrgDb="org.Hs.eg.db", keyType="SYMBOL", ont="BP") ``` 其中,`OrgDb`参数指定了使用的数据库,这里我们使用人类基因组数据库;`keyType`参数指定了您的基因ID类型,这里我们使用基因符号;`ont`参数指定了您要进行的富集分析类型,这里我们使用生物过程(BP)。 5. 最后,您可以使用ggtree包中的ggsave函数将富集分析结果以图形化的方式呈现出来。这里我们以绘制条形图为例,您可以根据需要进行修改: ```R library(ggplot2) library(ggtree) plot <- ggtree(ego, aes(x=Description, y=-log10(pvalue))) + geom_bar(stat="identity") + coord_flip() + labs(x="GO Term", y="-log10(P-value)") ggsave("enrichment_plot.png", plot, width=10, height=6, dpi=300) ``` 这里我们以`-log10(P-value)`作为y轴(因为常见情况下P值非常小,使用-log10变换更方便观察),绘制了一个条形图,并将x轴标签设为GO术语描述。最后使用ggsave函数将绘图结果保存为`enrichment_plot.png`文件。 以上是一个基本的R语言流程,可以帮助您实现差异表达基因分析和GO富集分析。当然,具体的分析和绘图步骤可能会因为您的数据和设定而有所不同,您可以根据需要进行修改和调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值