第9章-用户分群方法-K-means聚类算法
给定个样本构成的样本集,每个样本有个特征。算法步骤如下:1、随机选取(超参数)个质心,其中,每个质心对应一个类别,分别记作;2、对于每个样本,计算该样本到每个质心的距离将分配到距离最近的质心对应的类别中,如下:;如果样本类别不再变化,停止。3、重新计算每个类别的质心得到个类别的质心。4、更新,继续步骤2。如图:图(a)中是所有的样本点的分布,从分布来看,初步将样本分为两类,所以设置;图(b)中红色和蓝色叉是随机选择的两个质心,类别分为标记为。
复制链接