聚类K-MEANS优化
算法分析1
对k个初始质心的选择比较敏感,容易陷入局部最小值。
例如,我们上面的算法运行的时候,有可能会得到不同的结果,如下面这两种情况。K-means也是收敛了,只是收敛到了局部最小值:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/22fe1560be86080c39769c73448e3feb.png)
K-Means算法优化1
使用多次的随机初始化,计算每一次建模得到的代价函数的值,选取代价函数最小结果作为聚类结果。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/8a4927aa77221de2fe9b1e293278d730.png)
算法分析2
k值的选择是用户指定的,不同的k得到的结果会有挺大的不同,如下图所示,左边是k=3的结果,蓝色的簇太稀疏了,蓝色的簇应该可以再划分成两个簇。右边
是k=5的结果,红色和蓝色的簇应该合并为一个簇。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/34af9c2a151ec313e85197c2dd1cd384.png)
K-Means算法优化2
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/38996ee0944327c1ced6f135a5a523ff.png)