K-means聚类算法

最新推荐文章于 2022-03-29 17:27:33 发布

爱计算机的程序媛

最新推荐文章于 2022-03-29 17:27:33 发布

阅读量1.5k

点赞数 1

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014359903/article/details/82385238

版权

K-means算法是一种基于划分的聚类方法，使用欧氏距离计算数据对象间的相似性。算法过程包括初始化类簇中心，迭代更新类簇中心并重新分配数据对象，直至满足停止条件。在鸢尾花数据集上实现，K-means表现出简单实现但对初始中心和类簇数量敏感等特性。k-means++可以改进初始中心选择，以提高聚类效果。

摘要由CSDN通过智能技术生成

k-means算法是一种基于划分的聚类算法，以距离作为数据对象间相似性度量的标准，即数据对象间的距离越小，则它们的相似性越高，则它们越有可能在同一个类簇。数据对象间距离的计算有很多种，k-means算法通常采用欧氏距离来计算数据对象间的距离。

（1）计算数据对象的距离

k-means通常采用欧氏距离来计算数据对象间的距离。下面给出欧式距离的计算公式：

（2）聚类过程中，每次迭代，对应的类簇中心需要重新计算（更新）：对应类簇中所有数据对象的均值，即为更新后该类簇的类簇中心。定义第k个类簇的类簇中心为Centerk，则类簇中心更新方式如下：

其中，Ck表示第k个类簇，|Ck|表示第k个类簇中数据对象的个数，这里的求和是指类簇Ck中所有元素在每列属性上的和，因此Centerk也是一个含有D个属性的向量，表示为Centerk=(Centerk,1,Centerk,2,...,Centerk,D)。

k-means算法思想可描述为ÿ

最低0.47元/天解锁文章

爱计算机的程序媛

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。