数据挖掘十大经典算法 之 K-Means算法

本文介绍了K-Means聚类算法,这是一种非监督学习方法,常用于数据挖掘。K-Means算法通过迭代寻找数据的聚类中心,使得同类内部对象相似度高,不同类对象相似度低。文章详细讲解了算法的原理、步骤、性能评价指标以及优缺点,并强调了初始中心选择对结果的影响和数据量大时的效率问题。
摘要由CSDN通过智能技术生成

一:非监督中的Kmean算法分类

聚类(clustering) 属于非监督学习 (unsupervised learning),无类别标记(class label).

观察下图,相同类别的通过属性之间的相似性聚集在一起,算法中并未涉及类别标记的问题。

二:K-means 算法详解

K-几个聚类中心  Mean-均值,每次迭代的时候使用均值方式迭代

 Clustering 中的经典算法,数据挖掘十大经典算法之一

 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。

算法思想:

以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果

算法描述:

(1)随机适当选择c个类的初始中心;

(2)在第k次迭代中,对任意一个样本,求其到c各

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值