R语言绘制热图实践(一)pheatmap包

R语言绘制热图实践 (一)pheatmap前言pheatmap包pheatmap简介常用参数介绍使用安装绘制样本间相关系数图(简单使用)差异表达基因热图(进阶使用)pheatmap总结corrplot包参考资料前言在生信分析中,我们常常需要计算一个样本的几次实验结果或者不同样本实验结果的相关系数(样本间相关系数)以判断几个数据集之间相关的程度。在本篇中及之后的内容中,为了用R得到相关系数热图...
摘要由CSDN通过智能技术生成

前言

在生信分析中,我们常常需要计算一个样本的几次实验结果或者不同样本实验结果的相关系数(样本间相关系数)以判断几个数据集之间相关的程度。
在本篇中及之后的内容中,为了用R得到相关系数热图(本篇中主要介绍了样本间的相关系数图,因为我刚好在做这个……),分别使用了pheatmap包(实验室的小伙伴推荐的)和corrplot包(我自己google找到的)进行了学习和实践,并对这些包中常用的参数进行了简单的介绍。

pheatmap包

pheatmap简介

官方介绍:
A function to draw clustered heatmaps where one has better control over some graphical parameters such as cell size, etc

pheatmap实际上是 Pretty Heatmaps 的缩写,简单地来说,一个可以傻瓜式绘制聚类热图的R包。

常用参数介绍

基础设置
main 图的名字
file 要保存图的名字
color 表示颜色,赋值渐变颜色调色板colorRampPalette属性,选择“绿,黑,红”渐变,分为100个等级,,例:color = colorRampPalette(c(“navy”, “white”, “firebrick3”))(102)
sclae 表示值均一化的方向,或者按照行或列,或者没有,值可以是"row", “column” 或者"none"
margins 表示页边空白的大小
fointsize 表示每一行的字体大小

聚类相关设置
cluster_cols 表示进行列的聚类,值可以是FALSE或TRUE
cluster_rows 同上,是否进行行的聚类
treeheight_row 设置row方向的聚类树高
treeheight_col 设置col方向的聚类树高
clustering_distance_row 表示行距离度量的方法
clustering_distance_cols 同上,表示列距离度量的方法
clustering_method 表示聚类方法,值可以是hclust的任何一种,如"ward.D",“single”, “complete”(默认), “average”, “mcquitty”, “median”, “centroid”, “ward.D2”

legend设置
legend TRUE或者FALSE,表示是否显示图例
legend_breaks 设置图例的断点,格式:vector
legend_labels legend_breaks对应的标签 例:legend_breaks = -1:4, legend_labels = c(“0”,“1e-4”, “1e-3”, “1e-2”, “1e-1”, “1”)

单元格设置
border_color 表示热图上单元格边框的颜色,如果不绘制边框,则使用NA
cellheight 表示每个单元格的高度
cellwidth 表示每个单元格的宽度
单元格中的数值显示:
display_numbers 表示是否将数值显示在热图的格子中,如果这是一个矩阵(与原始矩阵具有相同的尺寸),则显示矩阵的内容而不是原始值。
fontsize 表示热图中字体显示的大小
number_format 设置显示数值的格式,较常用的有"%.2f"(保留小数点后两位),“%.1e”(科学计数法显示,保留小数点后一位)
number_color 设置显示内容的颜色

热图分割设置
cutree_rows 基于层次聚类(使用cutree)划分行的簇数(如果未聚集行,则忽略参数)
cutree_cols 基于层次聚类(使用cutree)划分列的簇数

annotation相关设置
annotation_row 行的分组信息,需要使用相应的行名称来匹配数据和注释中的行,注意之后颜色设置会考虑离散值还是连续值,格式要求为数据框
annotation_col 同上,列的分组信息
annotation_colors 用于手动指定annotation_row和annotation_col track颜色的列表。
annotation_names_row boolean值,显示是否应绘制行注释track的名称。
annotation_names_col 同上,显示是否应绘制列注释track的名称。

使用

安装

install.packages(“pheatmap”) #安装pheatmap包
library(pheatmap) #加载pheatmap包
?pheatmap #查看pheatmap包里面的详细介绍
?pheatmap::pheatmap #查看pheatmap包里pheatmap函数的具体参数

绘制样本间相关系数图(简单使用)

(1)加载数据集:all_data
all_data为数据框格式,共包含9696996行,5列(5个样本),如下图所示。
在这里插入图片描述

colnames(all_data) <- c( 's1', 's2','s3 ', 's4','s5')  #为数据框指定列名

(2)求样本间的相关系数

matrix <- cor (all_data[1:5])   #数据框格式可直接使用cor函数求相关系数

得到的matrix:

  • 83
    点赞
  • 636
    收藏
    觉得还不错? 一键收藏
  • 19
    评论
评论 19
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值