kmeans算法

最新推荐文章于 2021-05-01 17:32:02 发布

haimianjie2012

最新推荐文章于 2021-05-01 17:32:02 发布

阅读量772

点赞数

分类专栏：机器学习文章标签： kmean 聚类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haimianjie2012/article/details/100563834

版权

机器学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

《百面机器学习》学习笔记

K均值算法的步骤、

选取初始聚类中心
通过计算距离进行聚类
重新计算聚类中心
重复2和3直到聚类中心不发生改变（或变化小于一定阈值）或者达到迭代次数上限。

K均值优缺点、

优点：1.原理简单，容易实现，收敛速度快，可解释性强；2.需要调节的参数较少（主要是聚类簇数K），且聚类效果好。

缺点：1.聚类簇数K不好把握，一般只能通过暴力搜索法来决定；2.只适合簇型数据，对其他类型数据聚类效果一般；3.当数据存在比较严重的类别不平衡时，聚类效果不好；4.当数据量比较大，计算量大，采用minBatch可以缓解，但可能会牺牲准确度。

K均值如何调优、

K均值如何改进、

随机选择K个聚类簇个数，存在很大的偶然性。可以使用改进版的kmeans++算法：a.随机选择第一个聚类簇中心点u1，b.然后计算各个样本点到该聚类中心的距离,选择距离最远的一个样本点作为第二个聚类簇中心u2，c.计算样本点到已有聚类簇中心距离，选择距离最远的样本点作为新的聚类簇中心，d.重复b和c直到找到K个聚类中心。
数据量非常大时，计算量非常大。可以使用miniBatch Kmeans：在做kmeans算法前先对大样本数据进行一个随机采样，对采样得到的样本使用kmeans聚类，进行多次miniBatch后进行多次kmeans聚类，最后选择最优的聚类簇。

K均值如何证明其收敛性

通过kmeans算法最大期望法，就可以说明EM收敛性等价于kmenas收敛性

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
kmeans算法

K均值算法的步骤、选取初始聚类中心通过计算距离进行聚类重新计算聚类中心重复2和3直到聚类中心不发生改变（或变化小于一定阈值）或者达到迭代次数上限。K均值优缺点、优点：1.原理简单，容易实现，收敛速度快，可解释性强；2.需要调节的参数较少（主要是聚类簇数K），且聚类效果好。缺点：1.聚类簇数K不好把握，一般只能通过暴力搜索法来决定；2.只适合簇型数据，对其他类型数据聚类效果...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

haimianjie2012 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。