R语言中ggplot2绘制热图,美化热图流程

ggplot2是一款强大的绘图R包,今天的笔记内容是学习使用ggplot2来绘制一幅热图,并进行美化调整。需要加载的包有两个:ggplot2、reshape2

如果你也想跟着笔记一起学习,请访问链接下载脚本:
https://down.jewin.love/?f=/Rscript/

访问上面的网址即可下载使用,也可以直接在Rstudio中运行下面这一句代码,则会自动在当前工作路径下生成11副PDF图片结果,稍加修改输入数据就能生成其他的热图。

source("https://down.jewin.love/?f=/Rscript/heatmap.R")

接下来利用示例数据进行简单的流程介绍:

如何绘制一幅热图?

前期准备与数据创建

首先,需要安装并加载这两个R包。

install.packages("ggplot2")
install.packages("reshape2")
library(ggplot2)
library(reshape2)

创建示例数据,并输出数据查看是否正常。

> data <- c(1:6,6:1,6:1,1:6, (6:1)/10,(1:6)/10,(1:6)/10,(6:1)/10,1:6,6:1,6:1,1:6,6:1,1:6,1:6,6:1)
> data #查看当前数据
 [1] 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 6.0 5.0 4.0 3.0 2.0 1.0 1.0 2.0 3.0 4.0
[23] 5.0 6.0 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.1 0.2 0.3 0.4 0.5 0.6 0.6 0.5
[45] 0.4 0.3 0.2 0.1 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 6.0 5.0 4.0 3.0 2.0 1.0
[67] 1.0 2.0 3.0 4.0 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0 1.0 2.0 3.0 4.0 5.0 6.0 1.0 2.0 3.0 4.0
[89] 5.0 6.0 6.0 5.0 4.0 3.0 2.0 1.0

将输入的data数据转化成数据框格式,并更改列名和行名,查看前五行数据观察是否正常。

> data <- as.data.frame(matrix(data,ncol = 12,byrow = T)) #转化成数据框
> colnames(data) <- c("Zygote","2_cell","4_cell","8_cell","Morula","ICM","ESC","4 week PGC","7 week PGC","10 week PGC","17 week PGC", "OOcyte")
> rownames(data) <- paste("Gene",1:8,sep ="_")
> head(data,5) #输出前五行
       Zygote 2_cell 4_cell 8_cell Morula ICM ESC 4 week PGC 7 week PGC 10 week PGC
Gene_1    1.0    2.0    3.0    4.0    5.0 6.0 6.0        5.0        4.0         3.0
Gene_2    6.0    5.0    4.0    3.0    2.0 1.0 1.0        2.0        3.0         4.0
Gene_3    0.6    0.5    0.4    0.3    0.2 0.1 0.1        0.2        0.3         0.4
Gene_4    0.1    0.2    0.3    0.4    0.5 0.6 0.6        0.5        0.4         0.3
Gene_5    1.0    2.0    3.0    4.0    5.0 6.0 6.0        5.0        4.0         3.0

新建一列命名为id,内容为每行数据的行名,这样做的目的是为了后续将数据用melt函数转化为长类型(每一行的value数值变量只有一项,作图所需数据格式),查看数据前5行进行观察。

> data$id <- rownames(data) #新建一列(ID),内容为数据的行名
> data_m <- melt(data,id.vars=c("id")) #将原来的数据转化成长数据格式,并以ID列为主因素
> head(data_m,5) #查看转换后的结果,该数据将用于后续的流程
      id variable value
1 Gene_1   Zygote   1.0
2 Gene_2   Zygote   6.0
3 Gene_3   Zygote   0.6
4 Gene_4   Zygote   0.1
5 Gene_5   Zygote   1.0

开始绘图

利用ggplot函数绘制热图,步骤:先初始化坐标轴(x= ,y= )然后设置填充类型和填充数据,在绘图函数后用+连接主题修改函数,可以在不断地修饰美化图片。

p <- ggplot(data_m,aes(x=variable,y=id)) #初始化,读入数据,设置x轴和y轴
p <- p + geom_tile(aes(fill=value))
#设置填充项为value值,绘制热图
p #查看生成的结果plot,在屏幕右下角处plot显示

保存图片

利用ggsave函数来保存生成的图片结果,这里演示将p保存到当前目录下,命名为my plot 1 .pdf,之后可以在相应目录下找到这张照片,无损矢量图方便修改。

ggsave(p,filename = "my plot 1.pdf",width = 10,
       height = 15,units = "cm",colormodel="srgb") 
#保存当前文件,生成的文件在当前工作目录下保存

刚刚那张图横轴的标签有的重叠到一起了,这样不好。那么如何对生成的热图进行后续调整呢?

美化热图

tips:切换显示主题与颜色

theme函数用于设置主题
axis.text.x表示x轴标签文本
element_text用来更改文本的角度(angle)、位置(hjust、vjust)
scale_fill_gradient表示用双色梯度方式填充显示。

p <- p + theme(axis.text.x = element_text(
   angle = 45,hjust = 1,vjust = 1)) #设置标签的显示方式
p <- p + scale_fill_gradient(
   low="white",high = "red") #设置填充颜色
p #查看结果

切换显示类型与数据展示方式

比如,我想在热图中同时展示两种颜色填充和数值,需要在上面的代码基础上略加修改,添加新的绘图参数。

p <- ggplot(data_m,  #输入文件
  aes(x=variable,y=id)) +  #初始化坐标轴
  xlab("samples") +  #x轴标签
  theme_bw() + #设置系统自带主题
  theme(panel.grid.major = element_blank()) +  #设置主项网格
  theme(legend.key=element_blank()) + #去掉背景颜色
  theme(axis.text.x=element_text(angle=45,hjust=1, vjust=1)) +  #设置坐标轴标签
  theme(legend.position="top") +  #设置图例的位置
  geom_tile(aes(fill=value)) +  #设置填充的值
  scale_fill_gradient(low = "white", high = "red") + #设置颜色梯度
  geom_point(aes(color=value), size=6) +  #设置点的颜色和大小
  geom_text(aes(label=value)) #设置文本显示数值
p #输出图片

试一试:重新更换一种主题样式,将红色填充去掉,并改为蓝色圆点加数值显示。

p <- ggplot(data_m,aes(x=variable,y=id)) +
  xlab("samples") + theme_bw() +
  theme(panel.grid.major = element_blank()) +
  theme(legend.key = element_blank()) +
  theme(axis.text.x = element_text(angle = 45,hjust = 1,vjust = 1)) +
  theme(legend.position="top")+ 
  geom_point(aes(color= value),size=6) +
  scale_color_gradient(low = "white",high = "blue") +
  geom_text(aes(label=value))
p

本节笔记到这里结束,感谢你的浏览,如果感觉有用欢迎转发分享,明天继续分享绘制热图过程中遇到数据的差异比较大时处理方法,对原始数据进行转化的技巧和应用。

参考引用:http://www.ehbio.com/Bioinfo_R_course/Rplots.html#ggplot2_heatmapmeihua

本文由mdnice多平台发布

ggplot是一个数据可视化包,可以用于创建各种图形,包括热图。在基因表达研究热图可以用于展示基因在不同样本或条件下的表达水平。 首先,我们需要准备基因表达数据和相应的样本信息。基因表达数据是一个包含基因名称和表达水平的矩阵,每行代表一个基因,每列代表一个样本。样本信息是一个包含样本名称、条件或类别等信息的数据框。 接下来,使用ggplot进行热图绘制。首先,我们需要用到ggplot的geom_tile函数,该函数可以创建矩形图块用于展示每个基因在每个样本的表达水平。通过设置颜色映射,可以将高表达和低表达的基因区分开来。我们还可以添加颜色条以表示表达水平的范围。 为了更好地理解基因表达数据的模式,我们可以对基因和样本进行聚类。在ggplot,我们可以使用row_cluster和column_cluster参数来控制基因和样本的聚类。通过将相似的基因和样本放在一起,我们可以更好地观察它们之间的相似性和差异性。 另外,我们还可以添加行和列的注释信息。例如,可以根据基因的功能或特征对基因进行分组,并在热图的边缘添加注释。这样可以帮助更好地理解基因的生物学意义。 最后,通过调整坐标轴标签、图例和标题等参数,我们可以进一步美化和定制热图的外观。这样我们就可以更直观地观察基因在不同样本或条件下的表达模式,发现隐藏在数据的模式和趋势。 总而言之,使用ggplot进行基因表达热图绘制可以帮助我们更好地展示和理解基因在不同样本或条件下的表达水平,并揭示基因之间的相似性和差异性。它是基因表达研究常用的数据可视化方法之一。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信分析笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值