文章参考哔哩哔哩
和K-means的不同:
1.每个样例有类别标签,即LVQ是一种监督式学习;
2.输出不是每个簇的划分,而是每个类别的原型向量;
3.每个类别的原型向量不是简单的均值向量,考虑了附近非/同样业的影响。
图例:
1. 从一堆样本点中随机选取点 ,初始化一组原型向量
。
2. 计算样本 与
的距离,找出与
距离最近的原型向量
。如图与样本点
距离最近的原型向量是
。
3.因为每个样例都有类别标记,若最近的原型向量 与
的标记类别相同,则令
向
方向靠拢,得到
。类似地,如果
与
的标记类别不同,则增大
和
的距离, 得到
从而更远离 。
4.循环,直到收敛。输出最后的原型向量。红线为相邻两个点连线的垂直平分线,将样本点进行簇的划分。