- 无监督学习的聚类算法,给多个点,给这些点分为k个类别。属于无监督学习。和KNN不一样,KNN是有监督学习,根据已存在的多个类别,判断样本属于哪一类(距离哪个已存在的类别近)。
- 思想:以空间中k个点为中心进行聚类,对最靠近他们的对象归类,通过靠近他们的对象归类,通过迭代的方法,逐次更新各聚类中心的值,知道得到最好的聚类结果
- 算法描述(算法实现过程)
- 选择c个类的初始中心,随便选
- 在第k次迭代中,对任意一个样本,求其到c各中心的距离,将该样本归到距离最短的那个中心所在的类
- 利用均值等方法更新该类的中心值
- 对于所有的C个聚类中心,如果利用2/3步的方法迭代更新后,均值保持不变,则迭代结束;否则继续迭代