这篇文章是根据作业修改后得到的,个人感觉写的比较详细了。但还有许多不足,希望大家评论指出。
K均值聚类与模糊K均值
1. 算法原理及流程
相关名词解释如表1。
表1-相关名词解释
1.1 K均值算法原理
K均值是基于原型的、划分的聚类计数。K均值使用质心定义原型,质心是一组点的均值。
1)首先,选择K个初始质心(通常随机初始化),其中K是用户预期的簇个数。
2)每个点指派到最近的质心,而指派到一个质心的点集合为一个簇。这里的距离量度有多种,通常采用欧几里得距离:
SSE为误差的平方和(Sum of Squared Error, SSE), 为第 个簇, 为 中的点, 为第 个簇的均值。
3)然后,根据指派到簇的点,更新每个簇的质心。
4)重复指派和更新步骤,直到簇不发生变化,或等价为质心不发生变化。