理解JPEG图像压缩算法,DCT变换

最新推荐文章于 2024-07-13 20:19:33 发布

nemoyy

最新推荐文章于 2024-07-13 20:19:33 发布

阅读量1.8w

点赞数 19

文章标签： JEPG DCT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nemoyy/article/details/80896449

版权

本文介绍了JPEG图像压缩算法的核心——离散余弦变换(DCT)。通过将RGB图像转换为YCbCr，然后对8x8块进行DCT变换，将图像信息集中在左上角，利用人眼对高频信息不敏感的特性，通过量化处理进一步压缩图像，最后使用Huffman编码等方法编码压缩。DCT的逆变换和量化过程解释了JPEG的有损压缩特性。

摘要由CSDN通过智能技术生成

理解JEPG原理

JEPG不是一种文件格式,而是一类图像压缩算法.

1.彩色图像

灰度图像

灰度,一个pixel取值0-255.
这里写图片描述

彩色图像

需要比灰度图像更多的存储空间, 事实上, 所有颜色都可以用红绿蓝三原色的组合表示, 彩色图像可用RGB三通道表示.

这里写图片描述

YCbCr

研究发现对于图像压缩, RGB的表示不是最佳的.

人脑对亮度(luminance)和色差(chrominance)的微小变化不敏感. YCbCr用一层亮度和两层色差表示RGB图像. Y是亮度通道, Cb和Cr是色差通道.

RGB转YCbCr是这样定义的,对一个 $(r,g,b)$ 元组, 先归一化 $(r',g',b') = (r/255, g/255, b/255)$ .

通过一下公式得到亮度值 $y:$

y = 0.299 r' + 0.587 g' + 0.114 b'

$y = 0.299r' + 0.587g' + 0.114b'$
色差通道通过计算red和blue两颜色通道和参照通道

y y $y$ 的差得到:

C b = (b^{'} - y) / 1.772

$Cb = (b'-y)/1.772$

C r = (r' - y) / 1.402

$Cr = (r'-y)/1.402$
1.772和1.402做分母使Cb和Cr都落在区间

[−1/2,1/2] [ − 1 / 2 , 1 / 2 ] $[-1/2, 1/2]$ .
最后一步, 为了显示将三通道缩放到

[0,255] [ 0 , 255 ] $[0,255]$ ,并取整:

Y = r o u n d (219 y + 16)

$Y = round(219y + 16)$

C b = r o u n d (224 C b + 128)

$C_b= round(224Cb+128)$

C r = r o u n d (224 C r + 128)

$C_r = round(224Cr+128)$

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

2.JPEG算法

JPEG不是一种文件格式,而是一类图像压缩算法, 下面我介绍的是JPEG2000,最基础的算法,可以帮助理解整个过程.

首先说一下怎么理解图像压缩, 以huffman编码为例, 对图像每个byte做频率统计, 构造huffman树重新编码, 以减小编码长度. 但是, 直接对图像做huffman编码的压缩并不好, 因为需要对256个像素值都编码, 码长不会显著减小.

如果能将图像变换到一个含有比较少的不同值的空间中, huffman编码效果将会显著提升. 这就是jpeg的核心思想.

2.1 预处理

先将RGB转成YCbCr, 然后把这三层当作灰度图像看就行, 操作是一样的.

然后, 将图像切割成一堆 $8\times8$ 的块.

这里写图片描述
所有操作都是独立对这样每一个 $8\times8$ 的小块做的.

2.2 DCT变换

考虑一个 $8\times8$ 的块, 这个块在原图像中所占的比例是非常小的, 在大部分情况下, 这个块中pixel数值变化是很平滑的. 打个比方,一个块正好罩在一面墙壁上, 这块的pixel值在79-81之间变化, 若要用cos函数的组合去拟合这段离散的数值, 这些函数的频率会很高.

这些变化也被称为高频信息, 而人眼对高频信息不敏感, 对低频信息比较敏感. 如果一个块罩在墙和背景交界的地方, 块的pixel数值会出现不平滑的变化,跨度很大, 这时要用函数组合去拟合这段离散数值时, 就会出现低频.

因此, 再结合图像压缩的核心思想, 用较少的不同数值来表示图像, 就需要找到一种变换, 将图像高频的信息和低频的信息区分开来, 并将人眼不敏感的低频信息映射到接近或等于0.

JPEG用的就是DCT(Discrete Cosine Transformation), 下面就是DCT矩阵, 任何 $8\times8$ 块都可以用DCT矩阵表示.

U = 1 2 ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ 2 \sqrt 2 cos π 16 cos 2 π 16 cos 3 π 16 cos 4 π 16 cos 5 π 16 cos 6 π 16 cos 7 π 16 2 \sqrt 2 cos 3 π 16 cos 6 π 16 cos 9 π 16 cos 12 π 16 cos 15 π 16 cos 18 π 16 cos 21 π 16 2 \sqrt 2 cos 5 π 16 cos 10 π 16 cos 15 π 16 cos 20 π 16 cos 25 π 16 cos 30 π 16 cos 35 π 16 2 \sqrt 2 cos 7 π 16 cos 14 π 16 cos 21 π 16 cos 28 π 16 cos 35 π 16 cos 42 π 16 cos 49 π 16 2 \sqrt 2 cos 9 π 16 cos 18 π 16 cos 27 π 16 cos 36 π 16 cos 45 π 16 cos 54 π 16 cos 63 π 16 2 \sqrt 2 cos 11 π 16 cos 22 π 16 cos 33 π 16 cos 44 π 16 cos 55 π 16 cos 66 π 16 cos

最低0.47元/天解锁文章

关注

19
点赞
踩
109

收藏

觉得还不错? 一键收藏
2
评论
理解JPEG图像压缩算法,DCT变换

理解JEPG原理JEPG不是一种文件格式,而是一类图像压缩算法.1.彩色图像灰度图像灰度,一个pixel取值0-255. 彩色图像需要比灰度图像更多的存储空间, 事实上, 所有颜色都可以用红绿蓝三原色的组合表示, 彩色图像可用RGB三通道表示.YCbCr研究发现对于图像压缩, RGB的表示不是最佳的. 人脑对亮度(luminance)和色差(...
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。