k-means算法有个很大的缺点,就是对孤立点敏感性太高,孤立点即是脱离群众的点,与众不同的点,即在显示中与其他点不是抱在一团的点。
为了体现两者的不同,我特意温习了一下知识,在构造初始点的时候,自己定义加入了几个孤立点,使用k-means算法跑的效果如下:
一开始的所有点:(可以看出其他点是混在一起有许多分类的)
使用k-means算法运行,定义3个中心点:
可以看到,此时的确是被分成了三类,只不过两个孤立点算在了一类
那么试一下k中心点算法,初始:
运算之后:
就这么简单,就验证了k中心点算法的优越之处
1.