获取pheatmap热图聚类后和标准化后的结果

pheatmap是简单常用的热图绘制包,可以快速、简单、可定制的绘制漂亮热图。具体见R语言学习-热图简化免费高颜值可定制在线绘图工具 ImageGP

现在要解决的一个问题是图出来了,想看下转换后用于绘图的表格,也就是获取聚类后的矩阵和聚类标准化后的矩阵。

生成测试数据

mat <- matrix(rnorm(30), nrow=5)

colnames(mat) <- paste("sample", 1:6, sep="_")

rownames(mat) <- paste("gene", 1:5, sep="_")

mat

结果如下

##          sample_1   sample_2   sample_3    sample_4   sample_5   sample_6
## gene_1 -0.3286368  0.3153119 -0.7730821 -0.85242874 -0.5303812  0.5088226
## gene_2 -1.3153020  0.3193550  0.4496518 -1.08782734  1.7620763 -0.9312810
## gene_3  0.6545161 -0.8220414 -1.1916559  0.04775437  0.2814619  1.8720241
## gene_4  1.0810986  0.2298092 -0.3615045  0.70162614  1.8572989  0.7250737
## gene_5 -1.8931573  2.7013864  0.5049798 -0.13541785 -1.7796036 -0.3185864

绘图

library(pheatmap)

# 绘图同时存储绘图结果
(a <- pheatmap(mat, cluster_rows = T, cluster_cols = T))

提取聚类后的原始矩阵

# 查看绘图数据的结构
# 直接查看会很大,这里只展示其前2层
# str: structure
str(a, max.level = 2)

# Rstudio中
# View(a)

结果如下

## List of 4
##  $ tree_row:List of 7
##   ..$ merge      : int [1:4, 1:2] -1 -4 -2 -5 -3 1 2 3
##   ..$ height     : num [1:4] 2.4 3.21 4.38 5.56
##   ..$ order      : int [1:5] 5 2 4 1 3
##   ..$ labels     : chr [1:5] "gene_1" "gene_2" "gene_3" "gene_4" ...
##   ..$ method     : chr "complete"
##   ..$ call       : language hclust(d = d, method = method)
##   ..$ dist.method: chr "euclidean"
##   ..- attr(*, "class")= chr "hclust"
##  $ tree_col:List of 7
##   ..$ merge      : int [1:5, 1:2] -1 -6 -2 -5 3 -4 1 -3 2 4
##   ..$ height     : num [1:5] 1.98 2.29 2.55 3.78 5.21
##   ..$ order      : int [1:6] 2 3 5 6 1 4
##   ..$ labels     : chr [1:6] "sample_1" "sample_2" "sample_3" "sample_4" ...
##   ..$ method     : chr "complete"
##   ..$ call       : language hclust(d = d, method = method)
##   ..$ dist.method: chr "euclidean"
##   ..- attr(*, "class")= chr "hclust"
##  $ kmeans  : logi NA
##  $ gtable  :List of 6
##   ..$ grobs        :List of 6
##   ..$ layout       :'data.frame':    6 obs. of  7 variables:
##   ..$ widths       :List of 6
##   .. ..- attr(*, "class")= chr [1:2] "unit.list" "unit"
##   ..$ heights      :List of 5
##   .. ..- attr(*, "class")= chr [1:2] "unit.list" "unit"
##   ..$ respect      : logi FALSE
##   ..$ rownames     : NULL
##   ..- attr(*, "class")= chr [1:4] "gtable" "gTree" "grob" "gDesc"
##  - attr(*, "class")= chr "pheatmap"

重新排列行和列

mat_cluster <- mat[a$tree_row$order, a$tree_col$order]

mat_cluster

完成提取

##          sample_2   sample_3   sample_5   sample_6   sample_1    sample_4
## gene_5  2.7013864  0.5049798 -1.7796036 -0.3185864 -1.8931573 -0.13541785
## gene_2  0.3193550  0.4496518  1.7620763 -0.9312810 -1.3153020 -1.08782734
## gene_4  0.2298092 -0.3615045  1.8572989  0.7250737  1.0810986  0.70162614
## gene_1  0.3153119 -0.7730821 -0.5303812  0.5088226 -0.3286368 -0.85242874
## gene_3 -0.8220414 -1.1916559  0.2814619  1.8720241  0.6545161  0.04775437

提取聚类后的标准化矩阵

(a <- pheatmap(mat, scale="row", display_numbers = T))

直接提取不太方便。这可以自己先对数据scale标准化处理,再排序。

mat_scale <- round(t(apply(mat, 1, scale)),2)
colnames(mat_scale) <- colnames(mat)
mat_scale

最终结果

mat_cluster <- mat_scale[a$tree_row$order, a$tree_col$order]

mat_cluster
##        sample_2 sample_3 sample_5 sample_6 sample_1 sample_4
## gene_3    -0.88    -1.22     0.13     1.58     0.47    -0.08
## gene_4    -0.63    -1.42     1.53     0.03     0.50    -0.01
## gene_2     0.38     0.49     1.59    -0.67    -0.99    -0.80
## gene_1     1.04    -0.87    -0.45     1.38    -0.09    -1.01
## gene_5     1.69     0.39    -0.96    -0.10    -1.03     0.01

R统计和作图

  • 3
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
K均值聚类是一种常用的无监督学习算法,旨在将数据点分为K个不同的簇,使得同一簇内的数据点趋于相似,不同簇之间的数据点趋于不相似。K均值聚类的可视化结果是指将聚类后的数据点在二维或三维空间中进行展示,以便于直观地观察和理解数据的聚类结果。 在K均值聚类后的可视化结果中,我们通常会使用散点图来展示数据点的分布情况。每个数据点的位置表示其在空间中的坐标,而颜色或符号通常用来表示数据点所属的簇。不同簇的数据点会被归为一类,并分别用不同的颜色或符号来标记,从而可以清晰地看出哪些数据点属于同一簇。 除了散点图,我们还可以使用其他的图形方式来进行可视化展示,例如曲线图、柱状图等。这些不同的图形方式可以帮助我们更好地理解和解释数据的聚类结果。 通过观察K均值聚类的可视化结果,我们可以获取一些有价值的信息。例如,我们可以看出聚类的效果如何,是否有明显的簇内相似性和簇间差异性。如果不同簇的数据点明显分离,而簇内的数据点趋于相似,那么聚类的效果较好。此外,我们还可以识别出异常点或离群点,这些数据点与其他的簇有较大的不相似性,可以作为进一步研究的对象。 总而言之,K均值聚类的可视化结果是一种直观且直观理解数据点聚类情况的方式。通过可视化展示,我们可以更好地理解和解释数据的聚类结果,并获得更多的有价值信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信宝典

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值