【论文学习】Guetzli:感知引导的JPEG编码器

Paper:Guetzli: Perceptually Guided JPEG Encoder

 摘要

Guetzli是一种新的JPEG编码器,旨在以比其他常见的JPEG编码器更低的比特率产生视觉上无法区分的图像。它使用闭环优化器优化JPEG全局量化表和每个JPEG块中的DCT系数值。Guetzli使用我们的感知距离度量Butteraugli [1]作为其优化过程中的反馈来源。根据Butteraugli,与我们尝试的其他压缩机相比,我们在给定的感知距离上减少了29-45%的数据大小。Guetzli的计算目前是非常缓慢的,这限制了其压缩静态内容的适用性,并作为一个概念证明,通过将高级心理视觉模型与有损压缩技术结合起来,我们可以大大减少大小。

1、介绍

        平均网页大小的三分之二用于图像表示:JPEG,GIF和PNG; 几乎一半的图像请求是JPEG,其字节大小比PNG和GIF大得多[2]。由于许多客户端,特别是移动客户端受到传输带宽的限制,我们可以通过减小大小来加快网站加载速度 的JPEG图像。 通过调整质量参数,标准JPEG编码器可通过调整尺寸来缩小视觉质量。 在这项工作中,我们研究如何减小JPEG图像的大小,而不会影响图像的感知视觉质量。

        我们在视觉上观察到用现有编码器编码的JPEG通常具有不均匀的质量; 他们经常只在图像的几个地方展示令人不安的文物。 通常,接近锋利边缘或线条的区域表现出更可见的伪影(例如,如图1所示)。 这导致我们认为进一步优化是可能的。 我们假设当编码器以有效的方式丢弃信息时,JPEG图像应该在恶化开始变得可见时开始大致均匀地降级。使用Guetzli,我们尝试导致视觉质量下降更均匀 并产生较小的JPEG图像

        

        Guetzli是一种开源的JPEG编码器[3],其针对非常高的感知品质。它执行闭环优化,由我们的人类视觉模型的Butteraugli提供反馈[1]。它的目标是根据Butteraugli发现人眼不能与原始图像区分的最小的JPEG。 Butteraugli考虑到大多数JPEG编码器没有使用的三个视觉特性。首先,由于锥体的灵敏度谱的重叠,伽马校正不应该分别应用于每个RGB通道。例如,看到的黄光量和对蓝光的敏感度。因此,可以更精确地编码黄色附近的蓝色变化(图2)。 YUV色彩空间定义为伽马压缩RGB

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
谷歌在开源社区发布了一款最新的JPEG图片编辑器Guetzli,其压缩能力强大。 ­  谷歌表示,Guetzli在将无损图片转换成JPEG格式的过程中,步骤与传统编辑器(如:libjepg)无异,但通过新型算法对图片的色彩和细腻度进行了优化,从而在画质与文件体积方面取得了完美平衡。 Guetzli,在瑞士德语中是“cookie(曲奇)”的意思,是一个针对数码图像和网页图像的 JPEG 编码器,能够通过产生更小的 JPEG 文件来达到更快的在线体验,并且同时保持与当前浏览器,图像处理应用和 JPEG 标准的兼容性。Google 称 Guetzli 创建高质量的 JPEG 图像文件的大小比当前的压缩方法要再小 35%。 JPEG 图像的视觉质量与它的多阶段压缩过程有关:色彩空间变换,离散余弦变换,以及量化等等。Guetzli 具体针对量化阶段,图像视觉质量损失越多,输出图像尺寸越小。Guetzli 努力通过一个搜索算法,来克服 JPEG 格式的精神视觉模型与 Guetzli 的精神视觉模型之间的差别,以一种更全面更详细的方式来结合色彩感知和视觉掩蔽,从而在最小化损失和最小化图像尺寸中达到平衡。不过,尽管 Guetzli 可以使图像尺寸更小,但创建压缩图像所花费的时间要与目前的方法更长。 上图为 16x16 像素样本,是挂在蓝天下的一根电话线,传统 JPEG 算法经常会遇到的失真状况。左边是未压缩的原图,中间为较小尺寸的 libjpeg,右边是失真更少的 Guetzli 。 Google 还表示在实验中把压缩图像的尺寸设为常数,相比于 libjpeg 输出的图像,在人工评估时大家总是更偏好 Guetzli 产生的图像,即使当 libjpeg 的图像和 Guetzli 的大小相同甚至更大一些。这点让他们觉得压缩速度慢一点也是值得的。       经笔者测试,Guetzli压缩极其耗时,采用单线程,125KB的图片压缩耗时达2分钟。github也有一群用户抱怨压缩极慢,8M的图片耗时20分钟。 看来被广大开发者应用还得解决性能问题才行,这样的耗时很多人都无法接受。 标签:guetzli  libjepg  谷歌

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值