数字图像处理与应用——图像和视频压缩技术

栗子不哭

已于 2022-01-27 17:12:51 修改

阅读量2.3k

点赞数

分类专栏：数字图像处理基础文章标签：图像处理计算机视觉

于 2022-01-27 13:41:05 首次发布

本文链接：https://blog.csdn.net/li1998zk/article/details/122712606

版权

5 篇文章 0 订阅

订阅专栏

图像压缩JPEG标准

JPEG是应用最广泛的静态图像压缩标准。

JPEG是针对标准彩色图像和灰度图像压缩的程序；
JPEG针对真实环境中的压缩效果较好，对工程图、卡通图、其他非真实感的图像压缩效果较差（原因在于其中利用到DCT线性变换，而DCT变换主要针对自然图像）；
JPEG即可以是有损压缩，也可以是无损压缩；
有损压缩：实际上是基于DCT变换的方法（与原始图像相比，在像素级别是不同的，但人眼的视觉系统看不出差异）；
无损压缩：基于预测方法，不能使用DCT变换（DCT变换的数学公式中有些无理数，一般计算机计算位数有限，在一定的位数上面会做截断，必然会导致像素级别上的差异）。

以上为压缩的大致流程。

以上为解压缩的大致流程。

Color sub-sampling

彩色图像：RGB空间 ==> YUV空间（Y表示亮度分量，U与V是两个色差的分量）；
之后对U、V进行采样（该步实际已经在做压缩。Why 只对色差分量做采样？人眼的视觉系统对亮度分量比较敏感，对两个色差分量并不敏感 ==> 尽量保持亮度分量不变，色差分量砍数据）；
对于16x16的图像块，经过操作之后，会包含6个8x8的块（1个16x16的亮度分量块，2个8x8的色差分量块，亮度分量是U、V的两倍大小 ==> 共形成4个8x8的亮度块，因此共组成6个8x8的块）。

Level shifting：

每个像素减去128，将(0, 255) ==> (-128, 127)（Why？自然灰度图中间的灰度值出现概率大，即靠近128的值非常多，减去128之后，图像中的大多数值会接近0，而在压缩的过程中，最希望看到的就是0，0可以采用巧妙的方式去处理，不会占用存储空间）。

图像块的尺寸是8x8，做8x8的DCT变换；

经过8x8DCT变换之后，8x8的图像块（共64个数字） ==> 得到的仍是64个数字，但空间已经发送了变化，前者表示像素点的灰度值，变换后表示该图像块在不同空间频率上的投影值，得到64个空间频率值，即在两个不同的domain当中，前者空间域，后者频率域，通常称为输入8x8图像块的“频谱”。

输入的8x8图像块，与上图中每一个子图像块做内积（点对点相乘再相加，最终得到标量），最终得到64个系数，表示该图像块在不同空间频率域上的投影，即频谱。

自然图像中，图像块中的点与点之间的灰度变化不是那么剧烈，变换相对光滑、缓慢，DCT变换刚好可以把这种光滑、缓慢的变换趋势，可以将该信号的能量集中在少数几个所谓的低频率的成分上。
理论上，DCT变化是一种无损变换，但实际上由于DCT变换包含一个“cosine”，是一个无理数，计算机只能计算有限位的数，但这一阶段不会有任何的信息丢失，信息丢失主要是在量化阶段。