概念
K-Means算法是一种无监督的学习,根据事先给定的分类数K,将所有对象划分为K个簇,且簇内的中心采用簇内所有对象的均值计算而成。
引用Peter Harrington著,李锐等人翻译的《机器学习实战》一书中伪代码流程如下:
创建K个点作为初始质心(通常是随机选择)
当任意一个点的簇分配结果发生改变时
对数据集中的每个数据点
对每个质心
计算质心与数据点之间的距离
将数据点分配到距其最近的簇
对每一个簇,计算簇中所有点的均值并将均值作为质心