论文PDF:Colorful Image Colorization
代码:github
- 摘要
给定一张灰度照片作为输入,本文解决了使照片的颜色看起来像幻像的问题。
这个问题显然受到限制,因此以前的方法要么依赖于重要的用户交互,要么导致色彩饱和。我们提出了一种全自动的方法,可以产生生动逼真的色彩。我们将问题摆在分类任务中,以解决问题的潜在不确定性,并在训练时使用类重新平衡来增加结果中颜色的多样性。该系统在测试时作为CNN中的前馈通道实现,并在超过一百万个彩色图像上进行了训练。我们使用“着色图灵测试”评估算法,要求人类参与者在生成的真彩色图像之间进行选择。我们的方法在32%的试验中成功地欺骗了人类,远高于以前的方法。
对于本文而言,目标不一定是恢复实际的真正颜色,而是要产生可能使人类观察者蒙蔽的合理颜色。因此,我们的任务变得更加容易实现:在灰度图像的语义和纹理及其颜色版本之间建立足够的统计依赖性模型,以产生令人信服的结果。 鉴于亮度通道L,我们的系统会在CIELab颜色空间中预测图像的相应a和b颜色通道.为了适当地模拟问题的多模态,我们预测每个像素可能的颜色分布.此外,我们在训练时重新加权损失,以强调稀有颜色.最后,我们通过退火来产生最终的着色.
在本文中的贡献来自两个方面。首先,我们通过(a)设计适当的目标函数来处理图像着色问题的多峰不确定性并捕获多种颜色,从而在自动图像着色的图形问题上取得了进展,(b)介绍了一种用于测试着色算法的新框架,该框架可能适用于其他图像合成任务,以及(c)通过训练一百万张彩色照片在任务上设置新的高水位线。其次,我们将着色任务作为一种竞争性,直接的方法进行自我监督的表示学习,并在多个基准上获得了最新的结果。
网络结构:
参考: