ward's method分层聚类凝聚法

ward's method是分层聚类凝聚法的一种常见的度量cluster之间距离的方法,其基本过程是这样的(参考:http://blog.sciencenet.cn/blog-2827057-921772.html )

  1. 计算每个cluster的ESS

  2. 计算总的ESS

  3. 枚举所有二项cluster【N个cluster是N*(N-1)/2个二项集】,计算合并这两个cluster后的总ESS值

  4. 选择总ESS值增长最小的那两个cluster合并

  5. 重复以上过程直到N减少到1

这个方法其实效率比较低,特别是算cluster的ESS值还要先求均值点,然后算距离的平方再求和,不过有一个快速的计算方法叫Lance-Williams Algorithm可以大大简化ward method的计算。先来一个图(来源:https://www.youtube.com/watch?v=aXsaFNVzzfI

转载于:https://www.cnblogs.com/shanyr/p/11100009.html

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
分层聚类和Kmeans聚类是两种不同的聚类,它们的区别主要在以下几个方面: 1.算原理 分层聚类是一种基于距离的聚类,它通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方。 Kmeans聚类是一种基于中心点的聚类,它通过将数据点分配到最近的中心点来创建聚类。在聚类过程中,首先随机选择k个中心点,然后将每个数据点分配到最近的中心点所在的聚类中,接着重新计算每个聚类的中心点,不断迭代直到聚类结果收敛。 2.聚类效果 分层聚类聚类效果相对较好,因为它可以生成一棵聚类树,可以根据需要选择不同的聚类结果。而Kmeans聚类聚类效果相对较差,因为它只能生成固定数量的聚类。 3.计算复杂度 分层聚类的计算复杂度较高,因为它需要计算所有数据点之间的距离,并且需要不断合并聚类。而Kmeans聚类的计算复杂度较低,因为它只需要计算每个数据点与中心点之间的距离。 4.适用场景 分层聚类适用于数据量较小、聚类效果要求较高的场景,例如生物分类学、社会学等领域。而Kmeans聚类适用于数据量较大、聚类效果要求不高的场景,例如数据挖掘、图像处理等领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值