k-means,k-mean++,ISODATA
一、k-means
步骤:
1)k-means算法在开始的时候就首先固定K个类别,并且随机选出对应的K个点,作为K个类。
2)然后对剩余所有的点进行分类,再对每个类中所有的点对应维度相加取平均值求质心,把该求得到的质心作为新的k个类别中心。
3)再对所有点进行分类,循环执行上述操作,直到每个类中所有点所属的类别不再发生变化(或者质心不再发生变化),则停止,算法结束。
具体的算法如下:
优点:容易实现
缺点:K需要提前确定好,难估计;可能收敛到局部最小值;数据量太大的话,计算量太大,收敛的速度会很慢。
二、k-means++
k-means++对比k-means&#