《A Neural Algorithm of Artistic Style》论文解读

最新推荐文章于 2022-03-21 10:04:02 发布

mumumuyanyanyan

最新推荐文章于 2022-03-21 10:04:02 发布

阅读量909

点赞数 4

分类专栏： CV 文章标签：神经网络风格迁移风格迁移深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_27634939/article/details/96732568

版权

CV 专栏收录该内容

2 篇文章 4 订阅

订阅专栏

发现工作还是比较偏向工程类，哪里需要你你就要调研哪里。最近由于风格迁移这一块调研性比较多，所以接下来会有一系列的风格迁移比较有代表性的论文解读，今天从始祖文《A Neural Algorithm of Artistic Style》开始。

该文章是神经网络风格迁移的始祖文，主要用优化的方式，不断地迭代，求全局最优解。

其主要思想比较简单，把图片当做可以训练的变量，也就是我们需要对像素点进行迭代更新，通过优化图片来降低与内容图片的内容差异以及降低与风格图片的风格差异，迭代训练多次以后，生成的图片就会与内容图片的内容一致，同时也会与风格图片的风格一致。

内容损失

其中 l 代表第 l 层的特征表示， p 是原始图片， x 是生成图片。 F 为生成图的特征图， P 为内容图的特征图。公式的含义就是于每一层，原始图片生成特征图和生成图片的特征图的一一对应做平方差。内容损失我们采用了 conv4_2 来计算。

风格损失

首先要引入 Gram 矩阵，可以表示不同通道间的特征关系，在这里用其来表示风格特征。

F 是生成图片的特征图。上面式子的含义： Gram 第 i 行，第 j 列的数值等于把生成图在第 l 层的第 i 个特征图与第 j 个特征图分别拉成一维后相乘求和。

上面是风格损失函数， Nl 是指生成图的特征图数量， Ml 是图片宽乘高。 a是指风格图片， x 是指生成图片。 G 是生成图的 Gram 矩阵， A 是风格图的 Gram矩阵， wl 是权重。
风格损失我们采用了 conv1_1， conv2_1， conv3_1， conv4_1 和 conv5_1 这 5层来计算。

总体损失

mumumuyanyanyan

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
《A Neural Algorithm of Artistic Style》论文解读

发现工作还是比较偏向工程类，哪里需要你你就要调研哪里。最近由于风格迁移这一块调研性比较多，所以接下来会有一系列的风格迁移比较有代表性的论文解读，今天从始祖文《A Neural Algorithm of Artistic Style》开始。该文章是神经网络风格迁移的始祖文，主要用优化的方式，不断地迭代，求全局最优解。其主要思想比较简单，把图片当做可以训练的变量，也就...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。