说到图像压缩算法,最典型的就是JPEG、JPEG2000等。
其中JPEG 采用的是以离散余弦转换(Discrete Cosine Transform) 为主的区块编码方式(如图2)。JPEG2000则改用以小波转换(Wavelet Transform) 为主的多解析编码方式,小波转换的主要目的是将图像的频率成分抽取出来。
在有损压缩下,JPEG2000的明显优势在于其避免了JPEG压缩中的马赛克失真效果。JPEG2000的失真主要是模糊失真,而模糊失真的主要原因在于高频量在编码过程中一定程度的衰减。在低压缩比情形下(比如压缩比小于10:1),传统的JPEG图像质量有可能比JPEG2000好。JPEG2000在高压缩比的情形下,优势才开始明显。
整体来说,JPEG2000相比于传统JPEG,仍有很大技术优势,通常压缩性能可提高20%以上。当压缩比达到100:1时,JPEG压缩的图像已经严重失真并开始难以识别了,而JPEG2000的图像仍可识别。
深度学习技术设计压缩算法的目的
通过深度学习技术设计压缩算法的目的之一是学习一个比离散余弦变换或小波变换更优的变换,同时借助于深度学习技术还可以设计更简洁的端到端算法,因而能够设计出比JPEG2000等商用算法性能更优的算法。
在图片、视频压缩领域,使用最多的深度学习技术就是卷积神经网络(CNN),下面会就卷积神经网络进行简单介绍。如图3所显示,像搭积木一样,一个卷积神经网络由卷积、池化、非线性函数、归一化层等模块组成。最终的输出根据应用而定,如在人脸识别领域,我们可以用它来提取一