R语言(ggplot2)画KEGG信号通路气泡图
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合性的生物信息学数据库,其中包含了有关基因、蛋白质、代谢途径和信号通路的详细信息。KEGG信号通路是KEGG数据库中的一部分,提供了有关生物体内分子间相互作用、信号传导和代谢途径的信息。
1. KEGG信号通路的数据表be like⬇
需要将原始数据处理成至少包含Term\Count\pValue\EnrichmentScore
四列的数据处理,上述还经过了对Count降序排序,最终保存为Excel数据,通过R语言中的openxlsx
程序包来读取该数据。
2. R语言ggplot2画气泡图
ggplot2 是一种用于数据可视化的R语言包,它提供了一种高度灵活和强大的方法来创建各种类型的图表和图形。ggplot2 是 Hadley Wickham 开发的,它基于“图形语法”理念,允许用户通过构建图层来轻松地控制图形的各个方面。以下是用ggplot2处理KEGG数据绘制气泡图的步骤。
2.1 R code
#修改工作路径(win下的路径使用“\\”)
setwd("C:\\Users\\Lin\\KEGG-plot")
#读入Excel数据
library(openxlsx)
data_kegg<-read.xlsx("up-KEGG.xlsx",sheet = 1)
#查看数据列名
colnames(data_kegg)
dim(data_kegg)
#ggplot2画气泡图,修改横坐标的名称为“Enrichment Score”,scale_color_gradient设置蓝红配色
library(ggplot2)
ggplot(data_kegg,aes(x=EnrichmentScore,y=Term))+geom_point(aes(size=Count,color=pValue))+theme_bw()+labs(y="",x="Enrichment Score")+ scale_color_gradient(low="blue",high="red")
#修改气泡图横向缩放度:coord_fixed(ratio=1/200)
ggplot(data_kegg,aes(x=EnrichmentScore,y=Term))\
+geom_point(aes(size=Count,color=pValue))\
+theme_bw()\
+labs(y="",x="Enrichment Score")\
+scale_color_gradient(low="blue",high="red")\
+coord_fixed(ratio=1/200)