JPEG原理分析及JPEG解码器的调试

本文链接：https://blog.csdn.net/harunoumi/article/details/125700334

本文介绍了JPEG图像压缩标准的基本原理，包括零偏置、8*8DCT变换、量化、DC系数差分编码、AC系数的Z字扫描与游程编码以及Huffman编码。量化是JPEG压缩的核心，通过不同量化表减少视觉冗余。同时，文章还涉及JPEG解码过程中的标记提取、量化表建立、Huffman表的构建，以及解码流程分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、简介

JPEG（ Joint Photographic Experts Group）即联合图像专家组，是用于连续色调静态图像压缩的一种标准，文件后缀名为.jpg或.jpeg，是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采用过高的压缩比例。

JPEG的性能，用质量与比特率之比来衡量，是相当优越的。

二、编解码原理

1、JPEG编码器的系统原理框图：

零偏置：对于灰度级为2n 的像素，通过减去2(n-1)，将无符号整数变为有符号数，以将绝对值大的数出现的概率大大减小，提高编码效率。
8*8DCT变换：对每个单独的彩色图像分量，把整个分量图像分成8*8的图像块，作为二维离散余弦变换DCT的输入，并进行DCT变换。以实现能量集中和去相关，便于去除空间冗余，提高编码效率。（若图像的宽或高不是8的整数倍的图像，使用图像边缘像素填充，以不改变频谱分布。）DCT是一种无损变换，也无法对图像进行压缩，这样做的目的是在为下一步的量化做准备。
量化：量化是编码流程中唯一会引入误差也是唯一会带来压缩效果的步骤。　由于人眼对亮度信号比对色差信号更敏感，因此JPEG使用了两种量化表：亮度量化值和色差量化值。根据人眼对低频敏感，对高频不太敏感的视觉特性，对低频部分采取较细的量化，对高频部分采取较粗的量化，减少了视觉冗余。量化矩阵并不是固定的，可以根据要求的质量的不同而进行调整。但经过量化，子块中的大多数高频区域的系数的量化结果都为0。
DC系数差分编码：经过8*8DCT变换后，DC直流系数的数值都比较大，且相邻图像块之间的DC系数变化不大（容易造成冗余），因此JPEG算法使用了差分脉冲调制编码DPCM技术对相邻图像块之间的量化DC系数的差值DIFF进行编码。
AC系数Z字扫描及游程编码：经过DCT变换后，AC系数大多集中在左上角的低频分量区，因此采用Z字形按频率的高低顺序读出可以出现很多连零的情况，便于使用游程编码，若最后的数据均为０，则直接给出EOB。
Huffman编码：对DC系数DPCM的结果和AC系数RLE的结果进行Huffman编码，类别ID采用一元码编码，类内索引采用定长码编码。共有亮度DC、亮度AC、色差DC、色差AC四张码表。

2、JPEG标记提取

3、量化

量化是编码流程中唯一会引入误差也是唯一会带来压缩效果的步骤，决定压缩质量，也只有因此是JPEG压缩编码算法的核心。JPEG标准中采用中平型均匀量化，输入DCT系数，输出量化系数。

由于人眼对亮度信号比对色差信号更敏感，因此JPEG使用了两种量化表：亮度量化值和色差量化值；根据人眼对低频敏感，对高频不太敏感的视觉特性，对低频部分采取较细的量化，对高频部分采取较粗的量化，减少了视觉冗余。

4、建立huffman表

Huffman表存储方式举例说明

n FF C4 00 3E 10 00 01 02 05 03 03 03 02 05 03 04 02 02 02 01 05 00 01 03 02 04 05 11 21 22 31 61 06 12 A1 32 41 62 13 51 23 42 71 81 91 15 52 63 07 14 33 53 16 43 08 B1 34 C1 24 D1 09 72 F0 A2

n 红色部分 （ 1 字节）为哈夫曼表 ID 和表类型，其值 0x10 表示此部分数据描述的是 AC 交流 0 号表。

n 蓝色部分 （ 16 字节）为不同位数的码字的数量。这 16 个数值实际意义为：没有 1 位的哈夫曼码字 …… 。

n 绿色部分 （ 3E-16-2-1=43 字节）为编码内容。由蓝色部分数据知道，此哈夫曼树有（绿色数据相加） =43 个叶子结点，即本字段应该有 43 个字节。这段数据表示 43 个叶子结点按从小到大排列，其权值依次为（ 16 进制）

n 看具体 JPEG 和 Trace 文件。

n 在读出哈夫曼表的数据后，就要建立哈夫曼树。具体方法为：

1）第一个码字必定为0。
如果第一个码字位数为1，则码字为0；
如果第一个码字位数为2，则码字为00；
如此类推。

2）从第二个码字开始，
如果它和它前面的码字位数相同，则当前码字为它前面的码字加1；
如果它的位数比它前面的码字位数大，则当前码字是前面的码字加1后再在后边添若干个0，直至满足位数长度为止。

三、代码调试

1、三个结构体

struct huffman_table
{
  /* Fast look up table, using HUFFMAN_HASH_NBITS bits we can have directly the symbol,
   * if the symbol is <0, then we need to look into the tree table */
  short int lookup[HUFFMAN_HASH_SIZE];
  /* code size: give the number of bits of a symbol is encoded */
  unsigned char code_size[HUFFMAN