1.Kmeans算法概述
1.1 Kmeans算法介绍
Kmeans是发现给定数据集的K个簇的算法。簇个数K是用户给定的,每一个簇通过其质心,即簇中所有点的中心来描述。
1.2 Kmeans算法工作流程
(1)创建K个质点作为起始质心;
(2)当任意一个点的簇分配结果发生改变时:
对数据集中的每个数据点
对每个质心
计算质心与数据点之间的距离
将数据点分配到距其最近的簇
对每一个簇,计算簇中所有点的均值并将均值作为质心
1.3 Kmeans算法优缺点
(1)优点:容易实现
(2)缺点:可能收敛到局部最小值,在规模数据集上收敛较慢
(3)应用领域:图片分割、商品归类、客户分类