写在前面的话
k-means 算法是一个聚类的算法 也就是clustering 算法。是属于无监督学习算法,也是就样本没有label(标签)的算分,然后根据某种规则进行“分割”, 把相同的或者相近的objects 物体放在一起。
在这里K就是我们想要分割的的聚类的个数。
当然了,很多资料都会说这个算法吧,毕竟简单粗暴可依赖
算法描述
首先我们有以下的几个点
A1 | (2,10) |
A2 | (2,5) |
A3 | (8,4) |
A4 | (5,8) |
A5 | (7,5) |
A6 | (6,4) |
A7 | (1,2) |
A8 | (4,9) |
这个算法不能帮助我们自动分类,所以我们需要指定我们需要的个数。其实在很多实际应用当中,我们很难知道我们的数据是什么分布的,应该分成几类比较好。这也是k-means自身的一个缺陷,所以不能帮助我们自动的聚类。
注:如果我在本文中说了分类,其实是分割的意思,我想表达的意思是聚类。
中文和英文切换,在意思上表达真的有点差距。<