【图像压缩】替换输入改善压缩+实现可变比特率

Wang, X., Jiang, W., Wang, W., Liu, S., Kulis, B., & Chin, P. (2021). Substitutional Neural Image Compression. http://arxiv.org/abs/2105.07512

绪论

本文提出了一种通用的增强神经图像压缩的模型SNIC。核心思想是,将输入图像看做可训练参数,优化得到最优输入。本方法可行的根本原因在于:图像压缩本质上是一种自监督过程,因此,在推理过程中,可以根据反馈改善模型参数或输入以提升性能表现。

方法

最优替换图像

把图像压缩看成两步映射过程,统一表示为\hat{x} = T(x)。作者提出疑问:当压缩一个指定的图像x_0的时候,以x_0为输入是否可以得到最优压缩效果?本文的想法为,寻找一个替代的x_0^{'}作为输入,执行同样的两步映射,如果能够使目标函数进一步下降则意味着可以通过将x_0替换为x_0^{'}来提高压缩性能。SNIC优化问题如下:

x_0^{*} := \mathop{arg\ min}_x \lambda D(\hat{x}, x_0) + R(x)\quad s.t.\ \hat{x} = T(x)(3)

需要指出的是,重建质量的比较对象依然是x_0,因为最终目标是要通过优化输入来获得对原图像x_0更好的重建效果。以上最优化问题,在SNIC中被替换为:

x_0^{*} := \mathop{arg\ min}_x \lambda_s D_s(\tilde{x}, x_0) + R_e(x)\quad s.t.\ \tilde{x} = T_e(x)

其中替换不可导操作(改为\tilde{x} = T_e(x), R_e(x))。

比特率、失真控制

用来生成替换图像和用来训练模型的损失函数是不同的。比特率控制可以通过改变损失函数中的\lambda_s实现。类似的,(3)中失真项也可以根据需要替换,不必和训练时相同。

直接比特率、失真控制

\lambda_s和结果比特率之间的关系未知而且可能不是线性的,因此调节\lambda_s来调节比特率很不方便。可以通过直接修改损失函数达到直接控制的效果:

\mathop{minimize}_x D_s(T_e(x), x_0) + k\ max \{ R_e(x)-R_t, \tau\}(4)

其中k是一个很大的常数,用以惩罚。因为梯度更新的时候可能会产生偏差,使用很小的值\tau弥补这种偏差。类似的,失真控制:

\mathop{minimize}_x R_e(x) + k\ max\{ D_s(T_e(x), x_0) -D_t, \tau\}

直接比特率控制的精度

影响直接比特率控制精度的因素:1)不可导操作的替换引入错误 2)优化问题通过梯度下降解决,可能不是最优解 3)x实际上是离散的(8-bit color RGB),可能会产生四舍五入错误。

替换隐层表示

除了替换输入外,优化以替换隐层表示也是一个可以尝试的方向。

实验

提升图像压缩性能

以下使用真实比特率而非估计结果。端到端模型ICLR2017,超先验模型ICLR2018。对于ICLR2017和ICLR2018中训练得到的每个模型实例,为每个实例单独应用SNIC,其中\lambda_s设置与训练时\lambda相同,经过100步梯度下降,在每次梯度更新后将像素值裁剪到[0,1]。下图为结果,体现了SNIC可以提升压缩效果的功能。

比特率控制

基于ICLR不同模型实例,使用(4)控制比特率,训练得到不同颜色曲线如下图。可以看到,当比特率比较高的时候,上界略高于原模型曲线,曲线下方变化范围比较大,当比特率比较低的时候变化范围就很小了,当到达界限的时候,即使继续改变loss函数中的值压缩效果也不会变化。SNIC高于原曲线的BPP范围约0.3,这说明可以通过在较少的模型上应用SNIC以覆盖原始曲线。

比特率控制的精度

(4)给出了一种明确指定目标BPP的方法,但是由于近似、噪声注入和舍入误差等因素,真实的BPP可能与目标不同。图6展示了重复采样结果BPP的分布(同一目标BPP重复100次),证明在实验中标准差足够小(大部分小于0.001),表明该方法是有效的。注意,平均值可以用额外一轮的生成为代价通过(4)中的\tau来校准。

SNIC的速度

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值