一:非监督中的Kmean算法分类
聚类(clustering) 属于非监督学习 (unsupervised learning),无类别标记(class label).
观察下图,相同类别的通过属性之间的相似性聚集在一起,算法中并未涉及类别标记的问题。
二:K-means 算法详解
K-几个聚类中心 Mean-均值,每次迭代的时候使用均值方式迭代
Clustering 中的经典算法,数据挖掘十大经典算法之一
算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
算法思想:
以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果
算法描述:
(1)随机适当选择c个类的初始中心;
(2)在第k次迭代中,对任意一个样本,求其到c各