K-Means算法（思想）

最新推荐文章于 2024-06-25 13:31:56 发布

空字符（公众号：月来客栈）

最新推荐文章于 2024-06-25 13:31:56 发布

阅读量2.6k

点赞数

分类专栏：机器学习文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/The_lastest/article/details/78120185

版权

K-Means算法的思想：

第一步：寻找最近的中心点

在给定的数据集上随机选取K（K已知）个点（向量）作为数据集上的K个中心（也就代表K个类别），然后依次遍历每一条数据，分别计算其与K个中心的距离，选择与之距离最近的点作为该数据所属的类别。这样一次遍历完之后，数据集中的所有点都被划入了其应该所属的类别里面（尽管有划错的）。

注意：初始中心点的选择，会影响到最终的分类结果，即可能不会收敛

第二步：重新计算中心

对于每一个类别来说，里面都有若干个点。由于之前的中心点事随机选取的，所以可定有不合理的中心点，于是我们就要重新计算中心点。然后再重复进行第一步的操作。

经过多次迭代前面两个步骤之后，最终的总代价将会收敛到一个最小值。此时的得到的聚类结果通常也就是最好的。

详细步骤：

现有如下数据集，欲将其分为3类，即K=3：

这里写图片描述

1.寻找最近的中心点

先随机取3个点 $\mu_1,\mu_2,\mu_3$ 作为中心点，然后分别计算每个点到 $\mu_1,\mu_2,\mu_3$ 的距离的平方（平方在计算的时候好处理，不含根号），选择最小的。其中， $\mu$ 为一个 $K\times n$

最低0.47元/天解锁文章

空字符（公众号：月来客栈）

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。