深度学习(10)——Deep Photo Style Transfer

本文介绍了Deep Photo Style Transfer技术,旨在解决神经风格转换(NST)在真实照片上产生的失真问题,通过写实正则化项和语义分割增强风格损失函数,实现了在保持图像逼真性的同时,有效地转移风格色彩。方法包括约束重构图像以利用内容图像的局部仿射色彩变化,以及应用语义分割掩码以改善风格匹配。实验结果表明,这种方法能有效防止图像扭曲,提供高质量的照片级风格转换效果。
摘要由CSDN通过智能技术生成

Deep Photo Style Transfer

1、贡献

基于Gatys等人的神经风格转换(NST)方法适用于艺术品风格,在真实照片上会由于“低级噪声”的影响产生像手绘的局部空间扭曲的效果。

这篇论文的贡献之一就在于成功抑制了图像扭曲,将风格变换约束在色彩空间的局部仿射变换中。

如图1所示,给定一个style图像(a)和一个内容图像(b),NST算法©成功地传输了颜色,但也引入了失真,使输出看起来像一幅画,这在照片风格转换中是不可取的。相比之下,我们的结果(d)在保持输出的逼真性的同时,也同样很好地传递了参考风格图像的颜色。在右边(e),我们显示了(b), ©和(d)的3个插值(按照这个顺序)放大比较结果。

其次对变换过程中由于输入图像和参考图像的内容不同而导致的不相关内容不在预期范围内的变换的出现提供了解决方案。比如,一个输入图像的天空内容比较少,风格变换可能会忽略掉内容上的差异而导致天空风格“溢出”到图像的其他部分,即天空用了地面的风格。

如图2 所示,给定一幅内容图像(a)和一幅风格图像(e), Gatys等人NST算法的(b)和Li等人CNNMRF算法的©的结果与我们的结果(d)相比,由于强畸变而呈现伪影。NST计算风格图像的全局统计,风格图像容易产生纹理不匹配,如对应关系(f)所示,如输出图像中从参考样式图像映射到建筑物的部分天空。CNNMRF计算风格图像的最近邻搜索,风格图像往往具有多对一的映射,如对应关系(g)所示,例如,参见建筑物。相比之下,我们的结果(d)防止了扭曲,并正确匹配纹理,如对应(h)所示。

2、方法

  • 加入图像写实正则化参数项,约束重构图像用内容图像的局部仿射色彩变幻防止扭曲
  • 基于内容图像的语义分割,增强结果的图像写实性

NST(Imagestyle transfer using convolutional neural networks)的基本算法如下:
L t o t a l = ∑ l = 1 L α l L c l + Γ ∑ l = 1 L β l L s l L_{total} = \sum^L_{l=1} \alpha_l L^l_c + \Gamma\sum^L_{l=1}\beta_l L^l_s Ltotal=l=1LαlLcl+Γl=1LβlLsl

L c l = 1 2 N l D l ∑ i , j ( F l [ O ] − F l [ I ] ) i , j 2 L^l_c = \frac{1}{2N_l D_l}\sum_{i,j}(F_l[O]-F_l[I])^2_{i,j} Lcl=2NlDl1i,j(Fl[O]Fl[I])i,j2

L s l = 1 2 N l 2 ∑ i , j ( G l [ O ] − G l [ S ] ) i , j 2 { L}^l_s = \frac{1}{2N^2_l}\sum_{i,j}(G_l[O]-G_l[S])^2_{i,j} Lsl=2Nl21i,j(Gl[O]Gl[S])i,j2

其中, L L L 是卷积层数量, l l l 表示网络中第 l l l 层。每一层都有 N l N_l N

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值