统计聚类法的基本步骤:

统计聚类法的基本步骤:

1>形成数据框

2>计算距离阵

计算n个样品两两间的距离D。

3>进行系统聚类

(I)构造n个类,每个类只包含一个样品;

(2)合并距离最近的两类为一新类;

(3)计算新类与当前各类的距离,若类个数为1,结束;否则回到步骤(2)。

4>绘制聚类图

在系统聚类基础上,可用 plot()函数绘制系统聚类图。

5>画分类框

在系统聚类基础上,可根据rect.hclust()函数给系统聚类图加分类框。

6>确定分类结果

在系统聚类基础上,可根据cutree()函数给出具体分类结果。

系统聚类函数hclust()用法:

hc(D,method="complete"(最长距离法)或者“single”(最短距离法较常用)...)

D为相似矩阵,通常为距离矩阵。

案例分析:

首先创建数据:

x1=c(2,3,2,1)

x2=c(2,2,6,5)

plot(x1,x2)#散点图 X=data.frame(x1,x2)#形成数据框

dist(X,method = "euclidean")#欧氏距离

D=dist(X)#欧式距离 
D

min(D)

合并距离最近的两类为一新类,计算新类与当前各类的距离,最后将其绘制成系统图。

hc=hclust(D,"single") #系统聚类 hc

names(hc) [1] "merge" (合并) "height" "order" "labels" [5] "method" "call" "dist.method"

data.frame(hc$merge,hc$height)

plot(hc)

手动计算样例,蓝色和红色字:

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

墨染盛夏呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值