机器学习算法小整理之K-means

最新推荐文章于 2022-04-25 17:36:11 发布

VIP文章 abc52shenghuo

最新推荐文章于 2022-04-25 17:36:11 发布

阅读量712

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/abc52shenghuo/article/details/77856937

版权

1、工作原理：

首先从n个数据对象任意选择 k 个对象作为初始聚类中心；而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似

的（聚类中心所代表的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；不断重复这一过程直到标准测度函数（一般都采用均方差作

为标准测度函数）开始收敛为止。

2、算法流程：

采用贪心策略，通过迭代优化来近似求解。

（1）从 n个数据对象任意选择 k 个对象作为初始聚类中心；　　　　

（2）根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离；并根据最小距离重新对相应对象进行划分；　　

（3）重新计算每个（有变化）聚类的均值（中心对象）；

（4）循环（2）、（3）直到每个聚类不再发生变化为止（标准测量函数收敛）。

为避免运行时间过长，通常设置一个最大运行轮数或最小调整幅度阈值，若达到最大轮数或调整幅度小于阈值，则停止运行。

3、算法特点：

“物以类聚”

各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

优点：

（1）容易实现。

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法小整理之K-means

1、工作原理：K-means是一种基于划分的聚类算法。随机设定K个点作为初始聚类中心，算出样本中其余点与这K个点的距离，根据距离将这些点分配给最近的中心，计算平均值得到新的聚类中心。将这个过程不断重复，直到算法收敛，则聚类结束。2、存在问题：（1）需要预先依据实际经验指定k值；（2）对初始聚类中心敏感，容易导致聚类结果的不稳定；（3）随机选定初始聚类中心，易收敛于局部最优解，造
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。