聚类算法——python实现学习向量量化（LVQ）算法

最新推荐文章于 2024-06-20 10:07:37 发布

_almost_

最新推荐文章于 2024-06-20 10:07:37 发布

阅读量8.3k

点赞数 8

分类专栏： machine learning

本文链接：https://blog.csdn.net/u014028027/article/details/71799254

版权

学习向量量化（LVQ）算法是一种有监督的聚类方法，类似于K均值，但考虑了样本类别。算法通过初始化原型向量并根据样本类别调整，最终形成聚类。在每轮迭代中，样本与原型向量比较，如果类别一致则靠近，否则远离。此过程持续到满足停止条件。LVQ算法在小规模样本集上能有效应用。

摘要由CSDN通过智能技术生成

算法思想

学习向量量化算法和K均值算法类似，是找到一组原型向量来聚类，每一个原型向量代表一个簇，将空间划分为若干个簇，从而对于任意的样本，可以将它划入到与它距离最近的簇中。特别的是LVQ假设数据样本带有类别标记，可以用这些类别标记来辅助聚类。

大致思想如下：
1. 统计样本的类别，假设一共有q类，初始化为原型向量的标记为{t1,t2,……,tq}。从样本中随机选取q个样本点位原型向量{p1, p2 ,……, pq}。初始化一个学习率a,a 取值范围(0,1)。
2. 从样本集中随机选取一个样本(x, y)，计算该样本与q个原型向量的距离（欧几里得距离），找到最小的那个原型向量p，判断样本的标记y与原型向量的标记t是不是一致。若一致则更新为p’ = p + a*(x-p)，否则更新为p’ = p - a*(x - p)。
3. 重复第2步直到满足停止条件。（如达到最大迭代次数）
4. 返回q个原型向量。

举例说明

样本集比较小，只是举一个例子。

# -*- coding:utf-8 -*-
import re
import math
import numpy as np
import pylab as pl
data = \
"""1,0.697,0.46,Y,
2,0.774,0.376,Y,
3,0.634,0.264,Y,
4,0.608,0.318,Y,
5,0.556,0.215,Y,
6,0.403,0.237,Y,
7,0.481,0.149,Y,
8,0.437,0.211,Y,
9,0.666,0.091,N,
10,0.639,0.161,N,
11,0.657,0.198,N,
12,0.593,0.042,N,
13,0.719,0.103,N"""
#定义一个西瓜类，四个属性，分别是编号，密度，含糖率，是否好瓜

最低0.47元/天解锁文章

_almost_

关注

8
点赞
踩
37

收藏

觉得还不错? 一键收藏
2
评论
聚类算法——python实现学习向量量化（LVQ）算法

算法思想学习向量量化算法和K均值算法类似，是找到一组原型向量来聚类，每一个原型向量代表一个簇，将空间划分为若干个簇，从而对于任意的样本，可以将它划入到与它距离最近的簇中。特别的是LVQ假设数据样本带有类别标记，可以用这些类别标记来辅助聚类。大致思想如下： 1.统计样本的类别，假设一共有q类，初始化为原型向量的标记为{t1,t2,……,tq}。从样本中随机选取q个样本点位原型向量{p1, p2
复制链接

扫一扫

专栏目录