本文是本人对Lucas Theis,Wenzhe Shi, (Twitter London, UK )等人2017年发表的文章“LOSSY IMAGE COMPRESSION WITH COMPRESSIVE AUTOENCODERS” (有损图像压缩自编码器)的自我理解,,本人在看文章之前对神经网络只存在听过的阶段,对图像压缩有一定的了解,下边内容是自己的理解,,很浅显,也可能有错误的地方,希望相关人士能给予建议和帮助。
……………………………………………………………………………………………………………………………………
文章在其他文献的基础上,提出了一种基于传统卷积神经网络结构的有损图像自编码器(CAE),且对量化,熵率估计模块,以及神经网络训练模块做了相应的改进(增量训练策略),文章的目标是直接优化由自编码器产生的失真率权衡(用于神经网路的训练) ,且可实现高分辨率的图像在低分辨率的终端上显示,且图像压缩结果在SSIM,MOS分数等角度上可以和JPEG2000的结果媲美。具体模型如图:
CAE有三个部分组成:编码器f、