根据之前博文中k-均值算法表述,编写代码,对k-均值算法有个清晰认识
问题:将图中数据分成3组。
下图是整个k-均值算法的流程
1,首先选择 K 个随机的点,称为聚类中心(cluster centroids);
2,对于数据集中的每一个数据,按照距离 K 个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。
3,计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。
代码:对于数据集中的每一个数据,按照距离 K 个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。
代码:计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。
第一次计算
第六次计算
第十次计算