深度学习模型组件-AdaIN-自适应实例归一化（Adaptive Instance Normalization, AdaIN）

原创已于 2025-03-06 09:35:33 修改 · 1.5k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #计算机视觉 #图像处理 #分类 #聚类

于 2025-03-05 16:32:49 首次发布

深度学习模型组件专栏收录该内容

11 篇文章

订阅专栏

AdaIN-自适应实例归一化（Adaptive Instance Normalization, AdaIN）

自适应实例归一化（AdaIN）是一种用于风格迁移（Style Transfer）和图像生成的归一化方法，由 Huang & Belongie 在 2017 年提出。其核心思想是让目标风格图像的统计信息（均值和标准差）直接影响内容图像的特征，从而实现风格转换。AdaIN 主要用于 风格化生成任务，如 StyleGAN 和图像风格迁移（Style Transfer）等。

1. AdaIN 公式

给定一个内容特征图 x 和一个风格特征图 y，AdaIN 的计算公式如下：

在这里插入图片描述

其中：

x是 内容特征，通常由CNN提取；
y是 风格特征，由风格图像计算得出；
μ(x), σ(x) 分别是 内容特征的均值和标准差；
μ(y), σ(y) 分别是 风格特征的均值和标准差。

解释

归一化（Normalization）：先对内容特征x 进行实例归一化（Instance Normalization），即去掉它的均值并除以标准差，使其变成标准正态分布（均值为 0，标准差为 1）。
调整均值和标准差（Rescaling and Shifting）：用风格特征 y 的均值 μ(y) 和标准差 σ(y)重新调整内容特征，使其的统计信息匹配风格图像，从而达到风格迁移的效果。

2. AdaIN 的核心思想

(1) 为什么使用均值和标准差？

均值表示图像的整体色调，比如明亮或暗淡。
标准差 反映图像的对比度或纹理分布，如粗糙或光滑。
通过调整内容特征的均值和标准差，使其匹配风格图像的统计信息，就可以在保留内容的同时注入风格信息。

(2) 相比 Batch Normalization（BN）和 Instance Normalization（IN）

归一化方式	计算方式	主要用途	归一化范围
Batch Normalization（BN）	计算整个 batch 内的均值和标准差	训练深度网络，稳定梯度	在 batch 维度上
Instance Normalization（IN）	计算单个样本（每个通道）的均值和标准差	风格迁移（基本形式）	在单个样本的每个通道上
Adaptive Instance Normalization（AdaIN）	用风格特征的均值和标准差替换内容特征的	风格迁移、GAN	融合风格和内容

3. AdaIN 在 Style Transfer 和 GAN 生成任务中的应用

(1) 经典风格迁移

AdaIN 最初用于风格迁移任务（Style Transfer），相比传统的基于VGG-19的风格损失方法（如 Gatys et al. 2016），AdaIN 直接利用风格图像的均值和标准差来调整内容图像的特征，简化了计算过程，并且不需要复杂的风格损失，只需通过前馈网络即可实现风格化。

流程