015_SSSSS_ Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization

Artificial Idiots

于 2022-09-15 12:35:50 发布

阅读量348

点赞数

分类专栏：文章阅读笔记文章标签：深度学习算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/D_Trump/article/details/126868951

版权

文章阅读笔记专栏收录该内容

37 篇文章 14 订阅

订阅专栏

Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization

这篇笔记总结一下各种Normalization，不仅是AdaIN

1. Batch Normalization（BN）

对于输入数据 $\in R^{N \times C \times H \times W}$ , BN对于每一个独立的特征维度的均值和方差进行归一化。

在这里插入图片描述

其中 $\gamma,\beta \in R^C$ 是学习到的仿射参数， $\mu(x),\sigma(x) \in R^C$ 是数据的均值和方差。

在这里插入图片描述

BN在训练的时候对batch的大小要求比较高，一般需要较大的batch。而在inference的时候，需要用训练时每个batch的均值和方差（mini-batch statistics），再求期望作为推断时用到的均值和方差（popular statistics）。

2. Instance Normalization（IN）

IN与BN的主要区别在于均值和方差只在每个Instance内求得，而不在整个batch内求。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3. Conditional Instance Normalization（CIN）

CIN在IN的基础上加入了条件，其 $\gamma$ 和 $\beta$ 不再是只学习到一个，而是根据增加的条件输入不同，得到 $s$ 组不同的值，对应于不同风格的输入。

在这里插入图片描述

4. Adaptive Instance Normalization（AdaIN）

AdaIN不再通过学习得到 $\gamma$ , $\beta$ 而是用输入的条件数据 $y$ 来替代。

在这里插入图片描述

5. Layer Normalization（LN）

与BN的区别在于，BN是在Batch维度做的归一化，而LN则是在Layer上。
$\gamma \frac{x-\mu(x)}{\sigma(x)} + \beta \\ \mu_n(x) = \frac{1}{HWC} \sum_{n=1}^H\sum_{n=1}^W\sum_{n=1}^C x_{nchw} \\ \sigma_n(x) = \sqrt{\frac{1}{HWC} \sum_{n=1}^H\sum_{n=1}^W\sum_{n=1}^C (x_{nchw} - \mu_n(x))^2 + \epsilon}$

6. Group Normalization(GN)

GN与LN的区别在于，LN在所有的特征维度C上做归一化，但是GN则是在部分维度上做归一化。

在这里插入图片描述

。

Artificial Idiots

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
015_SSSSS_ Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization

Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization阅读笔记
复制链接

扫一扫

专栏目录

Artificial Idiots CSDN认证博客专家 CSDN认证企业博客

码龄6年

60: 原创

9万+: 周排名

34万+: 总排名

5万+: 访问

: 等级

770: 积分

89: 粉丝

89: 获赞

13: 评论

208: 收藏

私信

关注

热门文章

分类专栏

最新评论

李沐《动手学深度学习》学习笔记（1）Google Colab下的环境配置
weixin_41532377: 但是我这样操作后，每次还是需要重新安装。
003_SSS_ Tackling the Generative Learning Trilemma with Denoising Diffusion GANs
niko^__^: 您好！最近我也在研究DDGANs的论文，我有一个疑惑期望跟您探讨一下 1,DDPM假设去噪分布为高斯分布，而随机微分方程理论证明这样的假设只在降噪步长趋于 0 的时候成立，因此扩散模型需要大量重复的降噪步数来保证小的降噪步长，所以生成速度慢。 2,DDGANs则是抛弃去噪分布为高斯的假设，使用一个条件GAN来模拟这个降噪分布。 3,那么DDPM的加速模型（实际上只是修改了采样算法）比如DDIM也是有一个数据分布，去噪时是一个非马尔可夫链，那么用DDGANs里的条件GAN是否能拟合DDIM的去噪分布呢，这样是否会进一步提升生成速度呢我一直想不明白，希望跟您探讨一下
李沐《动手学深度学习》学习笔记（6）第一章预备知识第四节微分
WS_Change: 请问博主，这个f'h={h:.5f}是什么意思
005_SS_ Palette Image-to-Image Diffusion Models
道尔先生: 最后这个金色字体看瞎我眼
002_SSSS_ Denoising Diffusion Implicit Models
Artificial Idiots: 把减一换成减任意一个量就出来了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。