K-Means算法
主要步骤
K-Means算法是一个迭代算法,主要两个步骤
- 随机初始化K个点作为聚类中心,中心不一定是给出的点中的,不过最好选择样本中K个点作为聚类中心。
- 簇分配:遍历每个点,根据距离分配到K个聚类中心。如果没有点一般丢掉这个聚类中心,不过这种情况十分罕见。
- 移动聚类中心:找出所有同类的点,计算其位置均值,这就是新的聚类中心。再次进入2循环,直到聚类中心不改变。
目标优化函数(代价函数)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/b5cccf550b102ae6302b82a0a4e4b369.png)
初始化不同导致的局部最优
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/6fe66f0a7d083218cdd6e5e156c34c8f.png)
解决方法:多次计算计算代价函数。适用于聚类数目较小的情况。
局部最优原因
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/c10042003c9981ba251aaa3955148a33.png)
K值的选择
- 肘部法则
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/30ff501cd5c80faecfda62bbb900d470.png)
2.根据自己的目的确定个数。