【风格迁移系列三】（Adain）Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 论文解读

最新推荐文章于 2024-04-24 20:45:34 发布

kevinoop

最新推荐文章于 2024-04-24 20:45:34 发布

阅读量7.3k

点赞数 9

分类专栏：图像风格迁移文章标签： AdaIN 图像风格迁移

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kevinoop/article/details/91561214

版权

图像风格迁移专栏收录该内容

5 篇文章 5 订阅

订阅专栏

最近看了这篇论文 Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 。由于没有详细的博客参考，还是花了一些时间来阅读论文。于是提出自己对论文的理解，以供大家参考。下面直接进入主题：

1 Adaptive Instance Normalization

作者在 CIN 的基础上提出了 Adain ：
在这里插入图片描述
其中，x 和 y 分别是内容图片和风格图片 encode 后的特征图， $\sigma$ 和 $\mu$ 分别是均值和标准差。论文中说该公式将内容图片的均值和标准差与风格图片的均值和标准差对齐，我们可以这样理解：首先内容图片经过标准化后均值为0，标准差为1；然后乘以风格的标准差再加上风格的均值，Adain 的结果不就使得原来的内容特征图的标准差和均值与风格特征图的相同了吗？那么就可以说成它们的标准差和均值对齐了。

2 Model Architecture

在这里插入图片描述
论文的模型如上图：

首先将内容图片 c 和风格图片 s 输入 VGG 网络 $f$ ;
将 $f (c)$ 和 $f (s)$ 进行上述的 Adain 操作，得到 t；
最后通过 Decoder $g$ 输出风格迁移结果 $T (c, s)$ 。

3 Training

首先总损失的定义和其他的论文类似：
在这里插入图片描述
内容损失定义如下：

可以看上图的模型最右边进行理解， $f (g (t))$ 就是将得到的结果再输入到 vgg 中的结果，然后与 t 计算均方差损失。

风格损失定义如下：
在这里插入图片描述
这里是计算decode生成的结果的均值和方差和风格特征图的均值和方差的均方差损失。也就是让 $g (t)$ 和 $t$ 的方差和均值对齐。

4 Code

官方实现（Torch）: https://github.com/xunhuang1995/AdaIN-style
非官方实现（Pyorch）: https://github.com/irasin/Pytorch_Adain_from_scratch

关注

9
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
【风格迁移系列三】（Adain）Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 论文解读

最近看了这篇论文 Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization 。由于没有详细的博客参考，还是花了一些时间来阅读论文。于是提出自己对论文的理解，以供大家参考。下面直接进入主题：1 Adaptive Instance Normalization作者在 CIN 的基础上提出了 Adain ：...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。