K-means、K-means++、Mini Batch k-means

最新推荐文章于 2024-06-25 17:53:35 发布

真心乖宝宝

最新推荐文章于 2024-06-25 17:53:35 发布

阅读量516

点赞数 1

分类专栏：机器学习知识点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45069761/article/details/106826849

版权

本文详细介绍了K-means算法的基本步骤、时间空间复杂度及其存在的问题。针对K-means的问题，介绍了改进方法K-means++和Mini Batch k-means。K-means++通过优化初始聚类中心的选择来减少迭代次数，而Mini Batch k-means则通过随机抽样减少计算量，以平衡效率和准确性。

摘要由CSDN通过智能技术生成

K-means

K-means算法的基本步骤

1.从n个数据中任意选择 k 个对象作为初始聚类中心
2.通过把每个点分配给最近的聚类中心，从而形成K个类，重新计算每个类的聚类中心
3.终止条件：如果计算后，聚类中心不发生改变

每个类别聚类中心的计算方法

每个类中所有样本取值的均值(质心)

k-means时间空间复杂度

时间复杂度：O(i* n* k* m)
空间复杂度：O(n* m)
k是需要聚类的数量，m为每个元素属性个数(向量的维度)，n为数据量，i为迭代次数
一般均可认为是常量，所以时间和空间复杂度可以简化为O(n)

改进

K-means是常用的聚类算法，但其算法本身存在一定的问题，例如在大数据量下计算时间过长就是一个重要问题，
可以从两方面进行改进，一方面：通过改变初始聚类中心的选择，从而减少迭代次数；另一方面：随机抽取一部分样本代表各自类型进行计算，而不是使用全部样本进行更新计算。主要是以下两个改进方法：K-means++、Mini Batch k-means

K-means+&#

最低0.47元/天解锁文章

真心乖宝宝

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
K-means、K-means++、Mini Batch k-means

K-meansK-means算法的基本步骤1.从n个数据中任意选择 k 个对象作为初始聚类中心2.通过把每个点分配给最近的聚类中心，从而形成K个类，重新计算每个类的聚类中心3.终止条件：如果计算后，聚类中心不发生改变每个类别聚类中心的计算方法每个类中所有样本取值的均值(质心)改进K-means是常用的聚类算法，但其算法本身存在一定的问题，例如在大数据量下计算时间过长就是一个重要问题，可以从两方面进行改进，一方面：通过改变初始聚类中心的选择，从而减少迭代次数；另一方面：随机抽取一部
复制链接

扫一扫

专栏目录

真心乖宝宝 CSDN认证博客专家 CSDN认证企业博客

码龄5年

84: 原创

23万+: 周排名

154万+: 总排名

14万+: 访问

: 等级

1706: 积分

29: 粉丝

176: 获赞

53: 评论

460: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何判断有向图有环 --＞拓扑排序
Eli A: 下面放个链接疯狂跳转美团和淘宝什么意思
如何判断有向图有环 --＞拓扑排序
陌上迟迟归: 刚刚还把这道题提交给老师下午讲，看了你的，发现完了，我会了，这挺简单我还问老师不会杀了我吧
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化操作，同样GBDT也不需要。以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化处理，同样GBDT也不需要，以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
git代码回滚
泡面盖饭: 非常不错，感谢楼主的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。