k均值聚类算法

本文介绍了k均值聚类算法,包括算法描述和实例解析。算法描述部分提到了k值选定的困难,以及算法在处理大规模数据和存在噪点时的局限性。实例部分展示了一个将八个点聚类为三个类的问题,通过k-means算法进行聚类,并给出了第一次循环执行后的三个簇中心和最终的簇划分。
摘要由CSDN通过智能技术生成

算法描述

输入:簇的数目k和包含n个对象的数据库。 
输出:k个簇,使平方误差准则最小。 
算法步骤:  
1.为每个聚类确定一个初始聚类中心,这样就有K 个初始聚类中心。  
2.将样本集中的样本按照最小距离原则分配到最邻近聚类   
3.使用每个聚类中的样本均值作为新的聚类中心。 
4.重复步骤2.3直到聚类中心不再变化。 
5.结束,得到K个聚类 

这里写图片描述

伪代码

创建k个点作为起始质心(经常随机选择)
当任意一个点的簇分配结果发生改变时
    对于数据集中的每个数据点
        对每个质心
            计算质心于数据点之间的距离
        将数据点分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值