聚类算法（一）：k-均值 (k-means)算法

最新推荐文章于 2024-03-19 16:05:26 发布

VIP文章 chixujohnny

最新推荐文章于 2024-03-19 16:05:26 发布

阅读量6.4k

点赞数

分类专栏：数据挖掘文章标签：聚类分析 Python 算法 k-means k-均值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chixujohnny/article/details/50332561

版权

首先确保你在动手写代码之前已经了解什么是聚类分析。

k-均值算法----一种基于形心地技术的聚类算法。k-均值算法的英文名是k-means，那么这个算法是怎么工作的呢？

k-均值算法把簇的形心定义为簇内点的均值。它的处理流程如下：1.在数据点集D中随机的选择k个对象（这个k表示你要讲数据集分成几个簇），每个对象代表一个簇的初始均值或中心。2.对剩下的每个对象，根据其与哥哥簇中心的欧氏距离，将它分配到最相似的簇。3.k-均值算法迭代的改善内变差。对于每个簇，它使用上次迭代分配到该簇的对象，计算新的均值。 4.使用更新的均值作为新的簇中心。重新分配所有对象。 5.迭代继续，直到分配稳定，本轮行程的簇的中心点坐标与前一轮行程的簇相同。

算法：k-均值

输入：k：簇的数目

D：包含n个对象的数据集

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
聚类算法（一）：k-均值 (k-means)算法

首先确保你在动手写代码之前已经了解什么是聚类分析。k-均值算法----一种基于形心地技术的聚类算法。k-均值算法的英文名是k-means，那么这个算法是怎么工作的呢？k-均值算法把簇的形心定义为簇内点的均值。它的处理流程如下：1.在数据点集D中随机的选择k个对象（这个k表示你要讲数据集分成几个簇），每个对象代表一个簇的初始均值或中心。2.对剩下的每个对象，根据其与哥哥簇中心的欧氏距离，
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。