二分k-means
算法
二分k-means
算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。
分层聚类的策略一般有两种:
- 聚合。这是一种
自底向上
的方法,每一个观察者初始化本身为一类,然后两两结合 - 分裂。这是一种
自顶向下
的方法,所有观察者初始化为一类,然后递归地分裂它们
二分k-means
算法是分裂法的一种。
1 二分k-means
的步骤
二分k-means
算法是k-means
算法的改进算法,相比k-means
算法,它有如下优点:
- 二分
k-means
算法可以加速k-means
算法的执行速度,因为它的相似度计算少了 - 能够克服
k-means
收敛于局部最小的缺点
二分k