Learning to Cartoonize Using White-box Cartoon Representation 论文阅读
发表于CV2020。
介绍
由于动画风格多样,且需求多元,所以实用的动漫风格迁移算法需要以特定假设为前提。比如,一些动画制作流程更关注全局调色板主题(global palette theme),而不是线条的清晰度。从而导致黑箱模型没法应对各种多样的需求(简单的改变数据集不能解决问题)。
为了解决上述问题,我们将图片分解成几个动画表达形式:
首先,我们提取了surface表达,它表示图片的平滑表面。给定图片I∈RWxHx3,我们提取了一个加权的低频分量Isf∈RWxHx3,它保留了图片的颜色组成和表面纹理,但是忽视了边线、纹理和细节。(灵感来源于画家会在画细节前先画一个草图)
然后,提取structure,它捕捉了全局结构信息和稀疏的色块(in celluloid卡通风格)。我们从I中提取了一个segmentation map,然后对每个segmented region应用一个自适应的着色算法生成structure表达Ist∈RWxHx3。
接着,我们使用texture表达来包含绘制的细节和边缘。将I转化为单通道的密度图It∈RWxHx1,它移除了原有图片的颜色和亮度信息,只保留了相关的像素强度。(灵盖来源于画家首先会画一张具有轮廓和细节的线条草图,然后填色)它允许网络独立地学习高频的纹理细节。
这三个分开的表达有利于让网络通过特定任务的微调来适应多样的画风。
我们的主要贡献有如下几点:
我们基于对绘画习惯的观察提出了三个cartoon representation:surface, structure, texture。
用户可以通过平衡三个representation的权重来控制图片输出风格。
相关工作
Image Smoothing图像平滑:我们采用了differentiable guided