作为第一个博客,我写了一个简单的K均值聚类算法。过程大致如下:
(1)从n个样本中任意选择(一般是随机分配),k个作为初始聚类中心;
(2)对于剩下的其它样本点,根据它们与这些聚类中心的距离,分别将它们分配给与其最相似的中心所在的类别 C j;
(3)计算每个新类的聚类中心;
(4)不断重复步骤(2)(3),直到所有样本点的分类不再改变或类中心不再改变。
一、方法说明
在(2)计算距离的时候,我用的是欧式距离:
dij=∑k=1n(Xik−Xjk)2−
作为第一个博客,我写了一个简单的K均值聚类算法。过程大致如下:
(1)从n个样本中任意选择(一般是随机分配),k个作为初始聚类中心;
(2)对于剩下的其它样本点,根据它们与这些聚类中心的距离,分别将它们分配给与其最相似的中心所在的类别 C j;
(3)计算每个新类的聚类中心;
(4)不断重复步骤(2)(3),直到所有样本点的分类不再改变或类中心不再改变。
一、方法说明
在(2)计算距离的时候,我用的是欧式距离: