矢量量化（Vector Quantization）

最新推荐文章于 2025-05-01 09:07:55 发布

xiangcece

最新推荐文章于 2025-05-01 09:07:55 发布

阅读量1.2w

点赞数 19

分类专栏：图像处理

原文链接：https://blog.csdn.net/qq_16234613/article/details/79991191?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160673449019726891130797%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=160673449019726891130797&biz_id=0&utm_med

版权

图像处理专栏收录该内容

1 篇文章

订阅专栏

矢量量化是一种信号压缩方法，通过将连续信息转换为数字信号并进行整体量化来压缩数据。它涉及将多维空间划分为编码区域，并用码矢（量化矢量）近似表示每个区域内的数据。LBG算法是解决VQ设计的一种经典迭代方法，通过不断调整码书和空间划分来最小化失真度。VQ在图像压缩、语音识别等领域有广泛应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

矢量量化（Vector Quantization）

矢量量化（Vector Quantization）：是一种极其重要的信号压缩方法==[连续信息到数字信号的转化]。也是一种基于块编码规则的有损压缩方法。

基本思想：将若干个标量数据组构成一个矢量，然后在矢量空间给以整体量化，从而压缩了数据而不损失多少信息。

名词解释	内容
标量	只具有数值大小，没有方向，部分有正负之分
矢量	又称为向量
量化	指将信号的连续取值（或者大量可能的离散取值）近似为有限多个（或较少的）离散值的过程

VQ实际上就是一种逼近：使用一个数字近似地表示它周围的数字；例如数学中取整 $\lfloor x \rfloor$

二维例子：
在这里插入图片描述

上图，蓝色实线将这张图划分为16个区域；任意的坐标都会落到上面这张图中的某一特定区域。然后它就会被该区域的红星的点近似表示。

这些红星点就是量化矢量，表示图中的任意一个点都可以量化为这16个矢量中的其中一个。也就是这16个红星点可以描述这一整张图。

名词解释	内容
码矢（codevectors）	红星点
编码区域（encoding regions）	蓝色的划分区域
码书（codebook）	红星点的集合
空间的划分（partition of thespace）	蓝色的划分区域的集合

数学描述

假定我们有一个有M个矢量源（训练样本）的训练序列（训练集）：T={ $x_1, x_2,…, x_M$ }；
假设源矢量是k维的： $x_m$ =( $x_{m1},x_{m2}, …, x_{mk}$ ), m=1,2,…,M
假设码矢的数目是N，码书表示为：C={ $c_1, c_2,…, c_N$ }；
每一个码矢是个k维向量： $c_n$ =( $c_{n1}, c_{n2}, …, c_{nk}$ ),n=1,2,…,N；
与码矢 $c_n$ 对应的编码区域表示为 $S_n$ ，然后将空间的划分表示为：P={ $S_1, S_2,…,S_N$ }；
如果源矢量 $x_m$ 在 $S_n$ 内，那么它的近似（用Q( $x_m$ )表示）就是 $c_n$ :
Q( $x_m$ )= $c_n$ , 如果 $x_m$ 属于 $S_n$

假设我们采用均分误差失真度量，那么平均失真度表示如下：
$D_{ave}$ = $\frac {1}{Mk}\sum_{m=1}^M||x_m-Q(x_m)||^2$

||e||2为欧式距离

蓝色边界上的样本划分问题

1）Centroid Condition质心条件：
$c_n$ = $\frac {\sum_{x_m \in S_n}x_m}{\sum_{x_m \in S_n}1}$ $n = 1, 2, . . ., N$
这个条件要求码矢cn是编码区域Sn内所有的训练样本向量的平均向量。在实现中，需要保证每个编码区域至少要有一个训练样本向量，这样上面这条式的分母才不为0。

LBG算法

在以前，VQ运用的一个难点在于它要要解决一个多维积分（multi-dimensional integration）的问题。来，在1980年，Linde, Buzo和Gray（LBG，这个缩写也是LBG算法的命名）提出一种基于训练序列的VQ设计算法，对训练序列的运用绕开了多维积分的求解，使得世上又诞生了一种经典的被世人称为LBG-VQ的算法。

LBG-VQ算法是一个迭代算法，它交替地调整P和C；使失真度不断地趋向于它的局部最小值。这个算法需要一个初始的码书 $C^{(0)}$ ,这个初始码书可以通过分裂（splitting）方法得到。这个方法主要是把一个初始码矢设置为所有训练样本的平均值。然后把这个码矢分裂成两个（分裂的方式见下面的LBG算法的第3步的公式，只要是乘以一个扰乱系数），把这两个码矢作为初始的码书，然后迭代算法就在这个初始的码书上面跑。它每一次都将每个码矢分裂为2个，重复这个过程，直到获得要求的码矢个数。1个分裂为2个，2个分裂为4个，4个分裂为8个……