文章目录
1.核心思想
-
1.聚类算法中有超参数 K,理解为将数据划分为几个类别,一般现实实现时,知道划分类别的个数。例 K=3 时
-
2.随机在数据当中抽取 3个样本,当做三个类别的中心点(k1,k2,k3)
-
3.计算其余的点分别到这三个中心店的距离,每一个样本有三个距离(a,b,c),对每一个样本从(k1,k2,k3)中间选出距离最近的一个点作为自己的标记,形成一个族群;
-
4.分别计算这三个族群的平均值;把这三个平均值与之前的三个旧中心点进行比较。如果相同,则结束聚类;如果不同,则把这三个平均值点作为新的中心点,重复步骤 3;
-
聚类评估标准:轮廓系数
s c i = b i − a i m a x ( b i , a i ) sc_i=\frac{b_i-a_i}{max(b_i,a_i)} sci=max(bi,ai)