R语言：层次聚类分析（单、全、平均联动）+论文作图+计算距离矩阵+输出欧式距离

最新推荐文章于 2024-07-18 13:45:42 发布

皮肤小白生

最新推荐文章于 2024-07-18 13:45:42 发布

阅读量562

点赞数 3

分类专栏： R语言统计分析与作图文章标签： r语言

本文链接：https://blog.csdn.net/weixin_46587777/article/details/138031217

版权

R语言同时被 2 个专栏收录

90 篇文章 43 订阅

订阅专栏

统计分析与作图

58 篇文章 2 订阅

订阅专栏

聚类分析

层次聚类：对于小样本来说很实用（如150个观测值或更少）

每一个观测值自成一类
这些类每次两两合并
直到所有的类被聚成一类为止

划分聚类：能处理更大的数据量，但是需要事先确定聚类的个数

首先指定类的个数K
然后观测值被随机分成K类
再重新形成聚合的类

层次聚类方法可以用hclust()函数来实现，格式是hclust(d,method=)

其中d是通过dist()函数产生的距离矩阵
并且方法包括 "single"、"complete"、"average"、"centroid"和"ward"

摘自《R语言实践》

代码如下

setwd("D:/数据汇总/初步分析/聚类分析")
library(gclus)
library(vegan)
library(cluster)
#获得二元差异矩阵的函数，对于火和数据类型的聚类分析用cluster包中的daisy（）函数
grpdist <- function(X)
{
  require(cluster)
  gr <- as.data.frame(as.factor(X))
  distgr <- daisy(gr, "gower")
  distgr
}
mydata<-read.csv("表型聚类数据.csv")
data.norm<-decostand(mydata[,4:12],"normalize")
data.ch <- vegdist(data.norm, "euc")
dev.new(
  title = "Compare clustering methods",
  width = 12,
  height = 8,
  noRStudioGD = TRUE
)
par(mfrow = c(2, 2))
data.ch.single <- hclust(data.ch, method = "single")
plot(data.ch.single, 
     labels = rownames(mydata), 
     main = "Chord - Single linkage")
data.ch.complete <- hclust(data.ch, method = "complete")
plot(data.ch.complete, 
     labels = rownames(mydata), 
     main = "Chord - Complete linkage")
data.ch.UPGMA <- hclust(data.ch, method = "average")
plot(data.ch.UPGMA, 
     labels = rownames(mydata), 
     main = "Chord - UPGMA")
data.ch.centroid <- hclust(data.ch, method = "centroid")
plot(data.ch.centroid, 
     labels = rownames(mydata), 
     main = "Chord - Centroid")

皮肤小白生

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
R语言：层次聚类分析（单、全、平均联动）+论文作图+计算距离矩阵+输出欧式距离

并且方法包括 "single"、"complete"、"average"、"centroid"和"ward"层次聚类方法可以用hclust()函数来实现，格式是hclust(d,method=)层次聚类：对于小样本来说很实用（如150个观测值或更少）划分聚类：能处理更大的数据量，但是需要事先确定聚类的个数。其中d是通过dist()函数产生的距离矩阵。直到所有的类被聚成一类为止。然后观测值被随机分成K类。每一个观测值自成一类。
复制链接

扫一扫