【深度学习】A neural algorithm of artistic style算法详解

本文详细介绍了Gatys等人在2016年的风格迁移算法,该算法利用预训练的分类网络提取图像的风格和内容信息。通过梯度下降法调整输入图像,使其在特定层达到期望的风格和内容响应。实验表明,通过优化内容和风格的混合误差,可以在保留内容的同时,赋予图像新的艺术风格。
摘要由CSDN通过智能技术生成

Gatys, Leon A., Alexander S. Ecker, and Matthias Bethge. “A neural algorithm of artistic style.” arXiv preprint arXiv:1508.06576 (2015).

下面这篇发表于CVPR16,内容类似,排版更便于阅读。

Gatys, Leon A., Alexander S. Ecker, and Matthias Bethge. “Image Style Transfer Using Convolutional Neural Networks.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

概述

本文介绍Leon Gatys在2016年初大热的Style Transfer算法。这一算法结果直观,理论简洁,广受人民群众喜爱,在github上有各种平台的源码实现:

本文的核心思路如下

  • 使用现成的识别网络,提取图像不同层级的特征。
  • 低层次响应描述图像的风格,高层次响应描述图像的内容
  • 使用梯度下降方法,可以调整输入响应,在特定层次获得特定的响应。
  • 多次迭代之后,输入响应即为特定风格和内容的图像。

【辨】一般网络层有如下形式
x t + 1 = f ( W x t + b ) x_{t+1} = f(Wx_t+b) xt+1=f(Wxt+b)
网络的权重 W W W,网络的响应 x t + 1 x_{t+1} xt+1

特别要强调的是,常见的深度学习问题利用输入-输出样本对训练网络的权重。这篇文章中,是利用已经训练好的权重,获取一个符合输出要求的输入

复习:分类网络

直接使用VGG191分类网络(下图省略了末尾处做分类的几层)。和原始分类网络相比,本文仅将max pooling换成了average pooling,略微提升结果视效。
这里写图片描述

网络不同层次的响应描述了图像不同层次的信息:低层次描述小范围的边角、曲线,中层次描述方块、螺旋,高层次描述内容。

下文在提到“卷积层”时,实际指的是Conv+ReLU的复合体。用惯了Torch的同学尤其注意。

图像中的信息

使用分类网络中卷积层的响应来表达图像的风格和内容。

内容:响应

任取一张图像 X 0 X^0 X0,将其输入上述分类网络。其第 l l l个卷积层的响应记为 X l X^l Xl,其尺寸是 H l × W l × N l H^l\times W^l \times N^l Hl×Wl×Nl
对于目标图像 X 0 ‾ \overline{X^0} X0,同样送入该网络,可以得到该层响应 X l ‾ \overline{X^l} Xl

若希望 X 0 X^0 X0 X 0 ‾ \overline{X^0}

  • 17
    点赞
  • 61
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值