ward's method分层聚类凝聚法

最新推荐文章于 2025-03-24 16:40:40 发布

weixin_30952535

最新推荐文章于 2025-03-24 16:40:40 发布

阅读量8k

点赞数 1

文章标签：人工智能 r语言

原文链接：http://www.cnblogs.com/shanyr/p/11100009.html

版权

Ward's Method是一种分层聚类方法，通过最小化合并后cluster的误差平方和(ESS)来确定cluster间的距离。该文详细介绍了其计算流程：首先计算每个cluster的ESS，然后枚举所有可能的cluster组合，计算合并后的总ESS，选择使ESS增加最少的两个cluster进行合并，此过程重复直至只剩一个cluster。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ward's method是分层聚类凝聚法的一种常见的度量cluster之间距离的方法，其基本过程是这样的（参考：http://blog.sciencenet.cn/blog-2827057-921772.html ）

计算每个cluster的ESS
计算总的ESS
枚举所有二项cluster【N个cluster是N*(N-1)/2个二项集】，计算合并这两个cluster后的总ESS值
选择总ESS值增长最小的那两个cluster合并
重复以上过程直到N减少到1

这个方法其实效率比较低，特别是算cluster的ESS值还要先求均值点，然后算距离的平方再求和，不过有一个快速的计算方法叫Lance-Williams Algorithm可以大大简化ward method的计算。先来一个图（来源：https://www.youtube.com/watch?v=aXsaFNVzzfI

转载于:https://www.cnblogs.com/shanyr/p/11100009.html