JPEG原理分析&JPEG解码器调试

最新推荐文章于 2022-05-23 18:05:56 发布

ArchNexus

最新推荐文章于 2022-05-23 18:05:56 发布

阅读量392

点赞数

分类专栏： JPEG 数据压缩文章标签：图像处理

本文链接：https://blog.csdn.net/ArchNexus/article/details/117752788

版权

本文深入分析JPEG图像压缩标准，包括零偏置电平下移、8x8 DCT变换、量化及DC和AC分量的Huffman熵编码。详细探讨JPEG编解码流程，解析JPEG文件格式，并分享实验步骤，如解码输出YUV文件和查看量化矩阵、Huffman码表。

摘要由CSDN通过智能技术生成

1 JPEG原理

1.1 JPEG概述

JPEG（ Joint Photographic Experts Group）即联合图像专家组，是用于连续色调静态图像压缩的一种标准，文件后缀名为.jpg或.jpeg，是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采用过高的压缩比例。

1.2 JPEG编解码流程

在这里插入图片描述
接下来，我们以编码过程为例进行分析。

1.2.1 零偏置电平下移

· 将灰度级 $2^n$ 的像素值，全部减去 $2^{n-1}$ ，将无符号的整数值变为有符号数。
· 目的：图像初始平均亮度较高，通过这一操作将0电平移至中间，使得平均亮度降低、DCT变换之后的直流系数也随之降低，从而数据量也随之降低。

1.2.2 8x8 DCT变换（块划分）

· 将输入图像划分为8x8的数据块，如果原图像不是8x8的整数倍，需要进行块的补充。
· DCT变换，得到64个基底系数，其中（0,0）位置的是直流系数，是64个源数据的均值。
·DCT在复杂度和失真上是最好的权衡（trade-off）
我们暂时先只考虑水平方向上一行数据（8个像素）的情况时的DCT变换，从而来说明其物理意义。如下图所示：
在这里插入图片描述

原始的图像信号（最左边的波形）经过DCT变换之后变成了8个波，其中第一个波为直流成分，其余7个为交流成分。由于大多数图像的高频分量比较小，相应的图像高频分量的DCT系数经常接近于0，再加上高频分量中只包含了图像的细微的细节变化信息，而人眼对这种高频成分的失真不太敏感，所以，可以考虑将这一些高频成分予以抛弃，从而降低需要传输的数据量。这样一来，传送DCT变换系数的所需要的编码长度要远远小于传送图像像素的编码长度。到达接收端之后通过反离散余弦变换就可以得到原来的数据，虽然这么做存在一定的失真，但人眼是可接受的，而且对这种微小的变换是不敏感的。

1.2.3 量化

对亮度和色度分量的DCT系数进行量化，使用如下量化表，该量化表是从广泛的实验中得出的（当然，也可以自定义量化表。）：

//标准亮度分量量化表
static const unsigned int std_luminance_quant_tbl[DCTSIZE2] = {
16, 11, 10, 16, 24, 40, 51, 61,
12, 12, 14, 19, 26, 58, 60, 55,
14, 13, 16, 24, 40, 57, 69, 56,
14, 17, 22, 29, 51, 87, 80, 62,
18, 22, 37, 56, 68, 109, 103, 77,
24, 35, 55, 64, 81, 104, 113, 92,
49, 64, 78, 87, 103, 121, 120, 101,
72, 92, 95, 98, 112, 100, 103, 99
};

//标准色度分量量化表
static const unsigned int std_chrominance_quant_tbl[DCTSIZE2] = {
17, 18, 24, 47, 99, 99, 99, 99,
18, 21, 26, 66, 99, 99, 99, 99,
24, 26, 56, 99, 99, 99, 99, 99,
47, 66, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99
};

量化表搞掉了很多高频量，对DCT变换进行量化后得到量化结果，会出现大量的0，使用Z形扫描，可以将大量的0连到一起，减小编码后的大小。越偏离左上方，表示频率越高，这里其实是通过量化，将图像的高频信息干掉了。

在这里插入图片描述

1.2.4 DC和AC分量编码：Huffman+熵编码

DC进行DPCM编码，AC进行RLC编码。
在得到DC系数的中间格式和AC系数的中间格式之后，为进一步压缩图像数据，有必要对两者进行熵编码，通过对出现概率较高的字符采用较小的bit数编码达到压缩的目的。JPEG标准具体规定了两种熵编码方式：Huffman编码和算术编码。JPEG基本系统规定采用Huffman编码。

Huffman编码：对出现概率大的字符分配字符长度较短的二进制编码，对出现概率小的字符分配字符长度较长的二进制编码，从而使得字符的平均编码长度最短。Huffman编码的原理请参考数据结构中的Huffman树或者最优二叉树。

Huffman编码时DC系数与AC系数分别采用不同的Huffman编码表，对于亮度和色度也采用不同的Huffman编码表。因此，需要4张Huffman编码表才能完成熵编码的工作。具体的Huffman编码采用查表的方式来高效地完成。然而，在JPEG标准中没有定义缺省的Huffman表，用户可以根据实际应用自由选择，也可以使用JPEG标准推荐的Huffman表。或者预先定义一个通用的Huffman表，也可以针对一副特定的图像，在压缩编码前通过搜集其统计特征来计算Huffman表的值。

2 JPEG文件格式的解析

· 每一个JPEG文件的内容都开始于一个二进制的值 ‘0xFFD8’, 并结束于二进制值’0xFFD9’。

· 在JPEG的数据中有好几种类似于二进制 0xFFXX 的数据, 它们都统称作 “标记”, 代表了一段JPEG的信息数据。

· 在JPEG 格式中, 最开始先是用一些标记来描述数据,然后是放置SOS数据流的起始(Startof Scan) 标记。在SOS标记的后面才是, 存放JPEG图像的数据流并终结于EOI标记。

JPEG文件中重要的标记

这里仅列出几个常用标记的标记代码、长度和表示的意义。

SOI，Start of Image，图像开始，2字节，固定值0xFFD8。

· JPEG Start of Frame marker结构，帧图像开始

最低0.47元/天解锁文章

ArchNexus

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
JPEG原理分析&JPEG解码器调试

目录1 JPEG原理1.1 JPEG概述1.2 JPEG编解码流程1.2.1 零偏置电平下移1.2.2 8x8 DCT变换（块划分）1.2.3 量化1.2.4 DC和AC分量编码：Huffman+熵编码2 JPEG文件格式的解析JPEG文件中重要的标记3 实验步骤3.1 使用JPEG解码程序输出YUV文件3.2 程序理解大致框架3.3 输出量化矩阵，以及Huffman码表4.实验结果量化矩阵Huffman码表结论1 JPEG原理1.1 JPEG概述JPEG（ Joint Photographic..
复制链接

扫一扫