K-means算法思路总结

最新推荐文章于 2024-06-25 13:31:56 发布

NongfuSpring-wu

最新推荐文章于 2024-06-25 13:31:56 发布

阅读量1.6k

点赞数 1

分类专栏：机器学习文章标签： K-means聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41690708/article/details/95201860

版权

K-means算法是一种无监督学习的聚类方法，通过对数据对象的相似度进行划分，形成类簇。其过程包括随机初始化k个类中心，然后迭代地将数据点分配到最近的类中心并更新类中心，直至收敛或达到最大迭代次数。优点包括快速、高效且适合大规模数据。缺点则包括对异常值敏感，需预设K值，依赖初始质心选择，且仅适用于数值型数据和团状分布。为解决这些问题，可以尝试多次运行取最优结果，或使用其他聚类方法如谱聚类。

摘要由CSDN通过智能技术生成

k-means算法是一种聚类算法，所谓聚类，即根据相似性原则，将具有较高相似度的数据对象划分至同一类簇，将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于，聚类过程为无监督过程，即待处理数据对象没有任何先验知识，而分类过程为有监督过程，即存在有先验知识的训练数据集。k-means是一种无监督学习，它会将相似的对象归到同一类中。

k-means聚类的优缺点

优点：（1）算法快速、简单;
（2）对大数据集有较高的效率并且是可伸缩性的;
（3）时间复杂度近于线性，而且适合挖掘大规模数据集。K-Means聚类算法的时间复杂度是O(n×k×t) ,其中n代表数据集中对象的数量，t代表着算法迭代的次数，k代表着簇的数目　

缺点：（1）对异常值（噪声）敏感，可以通过一些调整（如中心值不直接取均值，而是找均值最近的样本点代替）

（2）需要提前确定K值（提前确定多少类）

（3）分类结果依赖于分类中心的初始化

最低0.47元/天解锁文章

NongfuSpring-wu

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。