https://blog.csdn.net/u013850277/article/details/88411966
算法描述
- K-means算法,也称为K-平均或者K-均值,一般作为掌握聚类算法的第一个算法。
- 这里的K为常数,需事先设定,通俗地说该算法是将没有标注的 M 个样本通过迭代的方式聚集成K个簇。
- 在对样本进行聚集的过程往往是以样本之间的距离作为指标来划分
算法步骤
- 根据K值划分簇的个数
- 计算两个簇的重心
- 求内类方差
- 求总体平方误差
- 根据数据项与重心的距离重新分配簇
- 重复2,3,4 直到平方差在允许范围内