JPEG压缩过程原理

GAXBER

已于 2023-10-11 15:25:49 修改

阅读量2.8k

点赞数 2

分类专栏：信息隐藏文章标签：图像处理

于 2023-10-11 15:25:04 首次发布

本文链接：https://blog.csdn.net/hyh14/article/details/133760338

版权

信息隐藏专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了JPEG图片压缩过程，包括RGB到YUV的映射转换、下采样、DCT变换、量化以及无损的熵编码，解释了人眼对图像频率敏感性的应用和有损压缩策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

JPEG压缩过程

第一步：RGB到YUV的映射转换（无损可逆变换）

第二步：下采样（有损压缩）

第三步 DCT变换（无损可逆变换）

第四步量化（留低频，弃高频）（有损压缩）

第五步熵编码（zigzag scan & 霍夫曼编码）无损

总结：

前言

JPEG也就是大家常见的图片格式之一，它还有一个小名，ipg。JPEG是一种有损压缩格式，相比于其他图片格式文件更小，也就是一些细节在压缩过程中丢失了，比较适合存储复杂的照片图像，不适合保存具有细节（线条）的图片。

我这里为了比较，选择低质量。

其他常见的图片格式有png，tiff等等。PNG是一种无损压缩格式，而且支持透明度，也就是说可以不保存那个白色的大背景，生成一种素材图，JPG格式就不支持透明。虽然PNG文件通常比JPG文件大，但是PNG文件的文件大小通常比其他无损压缩格式小。TIFF格式支持多种压缩方式，包括无损压缩和有损压缩，也支持透明。此外，TIFF保存的文件比较大，保存的图失真度极小，而且TIFF格式可以保存分层和透明信息。比如我保存了图层信息，打开还是可以编辑的。

JPEG压缩过程

JPEG压缩原理的动机：人眼对图像的亮度更敏感，对于色度变化不敏感。如下图，

经典的视错觉图，两个灰色是一样的，不信挡住中间看看。

所以，JPEG首先将图像的RGB空间进行映射，到YUV（也称YCbCr）颜色空间。Y表示明亮度，也是灰度（luma）；UV表示色度（也称CbCr，Chrominance-Blue，Chrominance-Red，其中Cb是蓝色色度分量，Cr是红色色度分量）。JPEG压缩要做的，就是保留明亮度，压缩色度。

第一步：RGB到YUV的映射转换（无损可逆变换）

RGB 转 YUV 的过程实际上就是把 RGB 3分量里面的亮度信息提取出来，放到 Y 分量。再把 RGB 3分量里面的色调，色饱和度信息提取出来放到 U跟 V分量。

Y亮度：

其中Kr，Kg，Kb分别表示不同的通道权重，且Kr+Kg+Kb=1。

那剩下的差值就是Cb，Cr，Cg，其中Cg是不用知道的，因为已知Y，Cb，Cr的话，Cg也是已知的了，我们只需要前三个就可以，Cg为冗余信息。

因为：

因此，Y分量写为：

U分量，即Cb分量写为：

V分量，即Cr分量写为：

但是，我们需要给他们规定范围，进行范围归一化，首先计算范围，

对于V分量：

范围为：

同理，U分量范围为：

因此，缩放系数设置为：

最后，公式为：

实验获得的参数为：

但是，对于YCbCr和RGB均在[0,255]时的转换关系的转换公式（未经伽玛校正），加上了偏移量：

Y = 0.299R + 0.587G + 0.114B
U = -0.1687R - 0.3313G + 0.5B + 128
V= 0.5R - 0.4187G - 0.0813G + 128

其他更加详细的转换公式见：
详解RGB和YUV色彩空间转换_yuv转rgb_古楼望月的博客-CSDN博客

例子：

第二步：下采样（有损压缩）

保留Y分量，对U和V进行下采样压缩，这是有损的。

YUV有多种采样比例，采用A:B:C表示法来描述Y,U,V采样频率比例：以黑点表示采样该像素点的Y分量，以空心圆圈表示采用该像素点的UV分量。

在JPEG压缩中，采用的就是4:2:0，这种采样方式是指对于扫描线上相邻的4个像素点的每个点的Y全部进行采集，而对于扫描线上，上下相邻的4个点，仅仅采集由这4个点计算得到的一个Cr和一个Cb值。换一种说法，即4个Y分量共用一组UV。Y'00、Y'01、Y'10、Y'11共用Cr00、Cb00，其他依次类推。

接上面的例子，如下图所示，只选取4个像素的左上角。