至此,划分方法的聚类算法已经讲得差不多了,其实只要把握住K-MEANS这条主线,抽丝剥缕,就可以将整个划分方法相关的聚类方法串联起来。
为了串联方便,于是将前面的相关内容都浓缩到了这一个流程图上。
K-MEANS缺点分别为:
(1)只能发现球状簇
(2)离群点的影响
(3)K值的选择
(4)初始中心点的选择
(5)标称属性问题
(6)局部收敛性
对应的改进方法也对应如下,可以发现一个K-MEANS算法串联起来了这么多的算法。
梳理好这个表,划分层次的聚类算法已经差不多了。当然最好是动手实践一下。
接下来就是层次聚类算法的相关内容,敬请期待。