K-means聚类算法

K-means算法是一种基于划分的聚类方法,使用欧氏距离计算数据对象间的相似性。算法过程包括初始化类簇中心,迭代更新类簇中心并重新分配数据对象,直至满足停止条件。在鸢尾花数据集上实现,K-means表现出简单实现但对初始中心和类簇数量敏感等特性。k-means++可以改进初始中心选择,以提高聚类效果。
摘要由CSDN通过智能技术生成

 k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离。

(1)计算数据对象的距离

         k-means通常采用欧氏距离来计算数据对象间的距离。下面给出欧式距离的计算公式: 

(2)聚类过程中,每次迭代,对应的类簇中心需要重新计算(更新):对应类簇中所有数据对象的均值,即为更新后该类簇的类簇中心。定义第k个类簇的类簇中心为Centerk,则类簇中心更新方式如下:

 

其中,Ck表示第k个类簇,|Ck|表示第k个类簇中数据对象的个数,这里的求和是指类簇Ck中所有元素在每列属性上的和,因此Centerk也是一个含有D个属性的向量,表示为Centerk=(Centerk,1,Centerk,2,...,Centerk,D)。

k-means算法思想可描述为ÿ

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值