K均值(K-means) 和 学习向量量化(LVQ)分别是怎么移动聚类中心的?
先说说k-means把:
1.k-means在 所有样本中 随机取了 某几个样本点作为数据中心(初始化)
2.遍历所有的样本, 计算每一个样本到达聚类中心的距离(这里的距离度量要自己选择),然后其中选择最近的那个聚类中心,
此时,在当前这轮遍历时间内,这个样本就归这个聚类中心,
3。在2结束后,所有样本都带有了一股标记:它是属于哪一个聚类中心的,反过来看,每一个聚类中心都有一团的样本块,依据该样本块的 所有样本求中心值,从而 聚类中心移动到该求得的中心值处,完成一次 聚类中心的移动。
4.不断重复2和3的过程,直到达到指定的迭代轮数 或者 每轮 迭代过程中,聚类中心的移动小于某个阈值。
LVQ:
LVQ的样本是有标记的,是有监督的。
1.一开始,LVQ定下 有几个聚类的簇中心,
2.然后随机从所有样本中抽取一个样本,计算它到所有聚类中心得距离,留下最近的一个,
3.查看该聚类中心的标签是否和样本的标签一致,若一致,则聚类中心靠近样本,否则该聚类中心远离样本。
4.不断重复2和3的过程,直到达到指定的迭代轮数 或者 每轮 迭代过程中,聚类中心的移动小于某个阈值。
补:LVQ2、LVQ3等改进算法能同时更新多个样本,显著提高收敛速度。
ok,直觉都很简单~~
88