K-means算法是聚类算法中最简单的一种。
聚类指的就是将一堆具有类似特征的无标签点归位一类,比如黑种人和黄种人由于身高、体型、肤色、毛发各个特征上的不同(单纯肤色说服力不够)而聚类为两个簇。
K-means算法通过迭代优化将样本聚类成k个簇。
算法流程:
1、任取k个质心
2、求出每个样本到每个质心的距离,并将其归至距离最近的簇。
3、根据上一步归类的样本,重新计算质心(各项特征的平均值)
4、迭代2、3直至质心不再变化
计算过程如图:
K-means算法是聚类算法中最简单的一种。
聚类指的就是将一堆具有类似特征的无标签点归位一类,比如黑种人和黄种人由于身高、体型、肤色、毛发各个特征上的不同(单纯肤色说服力不够)而聚类为两个簇。
K-means算法通过迭代优化将样本聚类成k个簇。
算法流程:
1、任取k个质心
2、求出每个样本到每个质心的距离,并将其归至距离最近的簇。
3、根据上一步归类的样本,重新计算质心(各项特征的平均值)
4、迭代2、3直至质心不再变化
计算过程如图: