K-means 算法迭代过程

最新推荐文章于 2025-04-21 19:53:53 发布

NineDays66

最新推荐文章于 2025-04-21 19:53:53 发布

阅读量1w

点赞数

分类专栏：机器学习、深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011808673/article/details/81296623

版权

机器学习、深度学习同时被 2 个专栏收录

99 篇文章

订阅专栏

56 篇文章

订阅专栏

本文详细介绍了K-means聚类算法的基本步骤，包括初始化聚类中心、数据点分配及聚类中心更新，直至收敛。讨论了算法的优点，如框架清晰、处理大数据集高效，以及缺点，如对k值预设的依赖、时间开销大和对异常数据敏感。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

K-means 算法的基本步骤：

1.从 n个数据对象任意选择 k 个对象作为初始聚类中心迭代
2.通过把每个点分配给最近的聚类中心，从而形成K个类重新计算每个类的聚类中心
3.终止如果计算后，聚类中心不发生改变

看图：仔细看每张图的变化更易理解（k = 2）

K-means 算法优点

算法框架清晰，简单，容易理解。
本算法确定的k个划分到达平方误差最小。当聚类是密集的，且类与类之间区别明显时，效果较好。
对于处理大数据集，这个算法是相对可伸缩和高效的，计算的复杂度为O(NKt)，其中N是数据对象的数目，t是迭代的次数。一般来说，K<<N，t<<N 。
K-means 算法缺点
K-means算法中k是事先给定的，这个k值的选定是非常难以估计的。
算法的时间开销是非常大的。
K-means算法对异常数据很敏感。在计算质心的过程中，如果某个数据很异常，在计算均值的时候，会对结果影响非常大。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

NineDays66 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。