机器学习 | k-means聚类算法

AI算法攻城狮

已于 2022-06-01 02:23:14 修改

阅读量2.2k

点赞数 2

分类专栏： # 机器学习算法原理文章标签：机器学习人工智能算法聚类 kmeans

于 2018-03-14 22:19:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jxq0816/article/details/79561201

版权

机器学习算法原理专栏收录该内容

65 篇文章 246 订阅 ¥99.90 ¥299.90

订阅专栏

视频教程：第12讲：聚类算法——无监督学习浅谈

k-means算法是非监督聚类最常用的一种方法，因其算法简单和很好的适用于大样本数据，广泛应用于不同领域，本文详细总结了k-means聚类算法原理。

算法思想：数据之间的相似度与它们之间的欧式距离成反比，根据数据之间的欧式距离将数据分成k类

(1) 首先随机生成k个聚类中心点。

(2) 根据已有的聚类中心点，将数据分成k类。分类的原则是数据离哪个聚类中心最近，它就被分为哪一类。这一步是EM算法中的E step。

(3) 根据分类结果，重新计算每个聚类的中心点。这一步是EM 算法中的M step。

(4)不断重复上述的E step和M step，直到聚类中心收敛（聚类中心不再变动）。

kmeas算法停止条件，满足其一即可

迭代超过最大轮数，即停止迭代
某次循环，没有数据点被重新分配到其他的簇，则算法结束迭代
某次循环，质心的位置没有发生变化，则算法结束迭代
某次循环，均方误差SSE递减的增量，小于预先设置的某个阈值，则算法结束迭代

目录

1. k-means聚类算法原理

2. k-means聚类算法步骤

3. k-means++聚类优化算法

4. 小批量处理的k-means聚类算法

5. k值的选取

6. k-means

了解本专栏

AI算法攻城狮

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习 | k-means聚类算法

K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。其中K值是目标聚类个数。算法过程1.初始化：随机初始化每个类别的质心2.计算每个点到各个质心的距离，并把点归到最近的质心的类3.重新计算已经得到的各个类的质心4.迭代2~3步，直到没有点变更所属类别，算法收敛...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI算法攻城狮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。