机器学习中的 K-均值聚类算法及其优缺点浅谈

最新推荐文章于 2023-09-05 17:00:44 发布

hdxx2022

最新推荐文章于 2023-09-05 17:00:44 发布

阅读量295

点赞数 1

分类专栏：编程语言前端文章标签：机器学习支持向量机人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hdxx2022/article/details/132520945

版权

编程语言同时被 2 个专栏收录

1066 篇文章 7 订阅

订阅专栏

17 篇文章 0 订阅

订阅专栏

K-均值聚类是机器学习中常用的一种聚类算法，其思想是将样本划分为 K 个簇，使得每个簇内的样本相似度较高，不同簇的样本相似度较低。

算法流程如下：

随机选择 K 个中心点（质心）作为初始簇中心。
将每个样本划分到距离该样本最近的簇中心所在的簇。
重新计算每个簇的中心点，并将其作为新的簇中心。
重复第 2 和第 3 步，直到簇中心不再变化或达到最大迭代次数。

K-均值聚类的优点包括：

相对简单，易于实现和使用；
对于大规模数据集，运行速度较快；
能够在众多聚类算法中表现较好。

K-均值聚类的缺点包括：

对于离群点的处理不够稳健，容易受到初始点的影响而得到不同的结果；
需要预先指定簇的数量 K，但在实际应用中往往难以确定；
聚类结果可能会收敛到局部最优解而非全局最优解。

因此，在使用 K-均值聚类算法时，需要谨慎地选择初始点和簇的数量，并注意处理离群点。

转自：微点阅读 https://www.weidianyuedu.com

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。