ECCV2022 Oral| 最强自动着色算法,无需前置条件

作者丨白乌鸦@知乎 (已授权)

来源丨https://zhuanlan.zhihu.com/p/540726540

编辑丨极市平台

导读

 

本文将介绍一个无需前置条件即可自动着色的算法,实现了目前最好的着色效果,性能在所有指标上打败了标准的CNN colorization方法以及Google在ICLR2021提出的方法。 

415d61f6869f8f641c9cd5ac90dbd5af.jpeg

论文过段时间会挂到实验室主页上,代码很快也会开源。

实验室主页:https://ci.idm.pku.edu.cn/

模型介绍

我们造了一个自动着色的Transformer模型,以color tokens作为辅助,实现了目前最好的着色效果。这里说的color tokens来自于经典工作《colorful image colorization》(CIC)中量化ab color space的思路,我们将每个格子都当做一个token,借助position embedding得到格子之间的位置关系,从而获得color token的颜色相对关系(离得远的色差大,否则小),从而设计一系列模块来引导color token监督着色。

5b2ee938e34e9e7604801263c203b9fd.jpeg

这里可视化一下我们的Pipeline,可以看到基本上不需要对transformer结构做太多魔改,只需要依靠我们设计的Luminance-selecting module, Color Attention和Color query等模块,依靠ab color space中颜色分布的先验知识,就可以实现好的着色性能。

974ab772aa44e089c3fdba16cdf9525d.jpeg

我们的模型不需要任何前置条件(例如目标检测主要着色物体,或者先用inversion GAN生成个参考图像),就能生成正确颜色语义和丰富饱和度的图像。因为没有前置条件的需求,所以使用场景更广(例如不受限于检测器可以检测的目标的类别,以及GAN可以生成的图像的类别)。

ec954d1c5ac1ea2d7ee2221b42680fb0.jpeg

实验结果

下面是我们的分数和user study,我们对比了标准的CNN colorization方法,以及Google在ICLR2021提出的第一个colorization transformer,最终性能在所有指标上都打过了他们;我们额外比较了一些热门的图像修复算法,但显然专门为colorization设计的算法性能更优;我们还比较了著名的预训练模型MAE,并把colorization当做他的一个下游任务来finetune,但他在这个任务上看起来也不是很聪明的样子。

29ba963defbbcd97c7066d0c625db8fc.jpeg

下面展示一些修复老照片的结果

4753a3e88b7b6c92469b9842bd0abcf0.jpeg

然后是一些灰白图像上色的结果

f6b7763bf4f8a0df8c45001f0063a012.jpeg390d5e6bd74103b8d6ec83fbb6f5c729.jpeg43c2ac1e5d0bf6a6cb898462ff93da4c.jpeg

推荐阅读

欢迎加入DLer-顶会论文分享交流群

大家好,这是顶会论文分享群里,群里会第一时间发布CVPR、ECCV、ICCV、NIPS、AAAI、ICML、ICLR的论文解读和交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

5598e3a2f4e60723591d87608ccf05c4.jpeg

👆 长按识别,邀请您进群!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值