图像压缩编码（1）有损压缩--预测编码

search7

已于 2024-09-02 11:08:19 修改

阅读量2.3k

点赞数 22

分类专栏：图像数字化文章标签：图像压缩编码

于 2024-08-29 17:33:39 首次发布

本文链接：https://blog.csdn.net/search7/article/details/141642400

版权

图像数字化专栏收录该内容

7 篇文章

订阅专栏

#灵感# 原始视频图像的数据量很大，直接传输或存储会有很多限制比如信道条件、存储设备。而图像也有很多冗余：空间冗余（相邻像素的相关性）、时间冗余（相邻帧之间的相关性）、结构冗余、知识冗余、视觉冗余，根据这些冗余特性，压缩数据量是完全可行的。

数字图像压缩编码方法一般分为两类：无损压缩、有损压缩。

无损压缩

无损压缩编码依据的是香农第一定理。原始图像在经过压缩编码、解码后可以完全得到恢复。由于编码与解码过程互逆，信息不会产生任何丢失，所以无损压缩编码又称可逆编码。无损压缩编码方法主要包括霍夫曼 (Huffman)编码、香农(Shannon) 编码、算术游程编码及 LZW 编码等。这类方法所能达到的压缩比一般不是太高。

有损压缩

有损压缩编码依据的是香农第三定理，又称不可逆编码。其利用人眼的视觉特性，在允许的失真条件下进行的，压缩过程中会损失一部分信息，解码时恢复的图像与原始图像之间存在一定的误差。

有损压缩编码以丢失一部分信息为代价，换来较高的压缩比。由于损失的信息量被控制在允许的范围内，因此对于理解原始图像信息的影响较小。

有损压缩编码主要分为以下几类：

（1）预测编码，一种针对统计冗余进行压缩的方法，通过减少图像数据在空间和时间上的相关性达到压缩目的。主要方法包括帧内预测编码、帧间预测编码等。

（2）变换编码，也是一种针对统计冗余进行压缩的方法，通过把空域图像信号 (矩阵)变换到频域，从而使能量集中到少量系数中，再进行处理，以达到压缩的目的。常用的变换有 KLT变换、DCT（离散余弦变换）、DWT（离散小波变换）等。

（3）子带编码，是在将图像数据变换到频域后，按频率划分成若干个子带分别进行处理，从而达到压缩目的的一种方法.

（4）模型编码，一种基于参数的编码方法，其核心是建立模型。编码时需要预先提取图像中的边界、轮廓、纹理等特征参数分别保存在编码端和解码端。编码时，根据保存在库中的特征参数对原始图像进行表示得到一组信息参数; 解码时，根据接收到的这组信息参数和预先保存在库中的特征参数重构出原图。由于传输的是一组信息参数，因而很大地压缩了传输的信息率。

【在实际应用过程中，通常会把多种编码方法组合起来，即采用混合编码的方法实现图像压缩。】

预测编码分类

根据已知像素与待预测像素之间的位置关系，预测编码可以分为三类。

一维预测也称行内预测，是指用于预测的已知像素与待预测像素处在同一扫描行内。如果用下图三个已知像素来预测 $X$ ，就是一维预测。-----空间相关性

二维预测又称帧内预测，是指用于预测的已知像素与待预测像素处在同一帧内、相邻的不同扫描行上。预测时，需要用到出现在待预测像素之前的已知像素(样值)，包括位于同一行、待预测像素左侧的已知像素(样值)，以及位于之前几行中的已知像素(样值)。比如用红线区域内的几个像素点来预测 $X$ 。-----空间相关性

三维预测又称帧间预测，用于预测的已知像素既有处在与待预测像素同一扫描行的，也有处于同一帧、相邻帧的相邻扫描行上的。特别的，用之前的帧预测当前帧的称为前向预测，用之后的帧预测当前帧的称为后向预测。----------空间+时间相关性？

视频是时间上的一个图像序列，由一帧帧的图像组成，拍摄同一场景时，相邻两帧之间的内容差异不会很大，即相邻两帧有很强的相关性（冗余度）。【帧间预测编码的任务就是消除图像在空间上的相关性以及图像序列在时间上的相关性，是视频信号压缩编码的重要途经。】

序列图像的运动估计

序序列图像在时间上的冗余情况可分为三种：

（1）对于静止不动的场景，当前帧和前一帧的图像内容是完全相同的。

（2）对于运动的物体（比如下图的红色车），只要知道其运动规律，就可以从前一帧图像推算出它在当前帧中的位置。

（3）摄像镜头对着场景作横向移动、调节焦距等操作会引起整个图像的平移、放大或缩小。如果摄像机的运动规律、镜头改变的参数已知，那么图像随时间所产生的变化也是可以推算出来的。

上述情况表明，发送端不一定必须把每帧图像上所有的像素都传给接收端，而只要将物体或摄像机的运动信息传给接收端，接收端就可以根据运动信息和前一帧图像的内容来更新当前帧图像。与传送每帧图像的具体细节相比，传送 “运动信息” 所需的数据量要小得多。如何从序列图像中提取有关物体的运动信息呢? 通常的做法是进行运动估值 (MotionEstimation，ME)，也称运动估计。

运动估计的方法目前分为块匹配方法和像素递归方法两大类，其中块匹配方法是目前广泛常用的方法。

块匹配方法：

块匹配基本思想是将每一帧图像划分为若干不重叠的子块，子块以宏块为单位，一个宏块大小为MxN (比如8x8, 16x16)。假设每个子块内的所有像素的位移量相同，即每个子块视为”一个运动物体“，那么取当前帧的每个子块，与相邻帧的各子块计算误差函数，其中误差最小的相邻帧的对应子块称为”块匹配“。块匹配与当前块之间的相对位移，构成了”位移矢量“，也叫运动矢量。

下图，块匹配的搜索在一定范围进行，比如搜索范围为SR=（M+2d）x (N+2d)。