【深度学习】Group Normalization阅读笔记

最新推荐文章于 2024-06-21 10:15:00 发布

1273545169

最新推荐文章于 2024-06-21 10:15:00 发布

阅读量279

点赞数

本文链接：https://blog.csdn.net/baidu_27643275/article/details/89472902

版权

Batch Normalization阅读笔记
 Batch normalization vs Instance normalization

目前归一化的主要方法：Batch Normalization（2015年）、Layer Normalization（2016年）、Instance Normalization（2017年）、Group Normalization（2018年）

归一化方法通用公式：
$\hat{x}_{i}=\frac{1}{\sigma_{i}}\left(x_{i}-\mu_{i}\right)$

$x_{i}$ 是某一层的特征， $i$ 是索引， $i=\left(i_{N}, i_{C}, i_{H}, i_{W}\right)$ 对应于特征图的 $(N, C, H, W)$ 。
$\mu_{i}=\frac{1}{m} \sum_{k \in \mathcal{S}_{i}} x_{k}, \quad \sigma_{i}=\sqrt{\frac{1}{m} \sum_{k \in \mathcal{S}_{i}}\left(x_{k}-\mu_{i}\right)^{2}+\epsilon}$

$y_{i}=\gamma \hat{x}_{i}+\beta$

Si is the set of pixels in which the mean and std are computed, and m
is the size of this set

应用场景

在这里插入图片描述
从左到右依次为BN、LN、IN、GN

1、BN（Batch Normalization）：在batch上，对NHW做归一化

$\mathcal{S}_{i}=\left\{k | k_{C}=i_{C}\right\}$

BN适用于图像分类识别任务

2、LN（Layer Normalization）：在channel上，对CHW做归一化
$\mathcal{S}_{i}=\left\{k | k_{N}=i_{N}\right\}$
LN适用于序列模型（RNN、LSTM）

3、IN（Instance Normalization）: 在像素上，对HW做归一化
$\mathcal{S}_{i}=\left\{k | k_{N}=i_{N}, k_{C}=i_{C}\right\}$
IN适用于生成模型（风格迁移、图像超分辨率等）

4、GN（Group Normalization）: 先将chanel分组，然后再分组在chanel上做归一化
$\mathcal{S}_{i}=\left\{k | k_{N}=i_{N},\left\lfloor\frac{k_{C}}{C / G}\right\rfloor=\left\lfloor\frac{i_{C}}{C / G}\right\rfloor\right\}$

GN是极端情况下可等价于LN和IN

GN的tensorflow实现，其他类似，只需在计算 mean和variable更改指定维度即可

import tensorflow as tf

def GroupNorm(x, gamma, beta, G, eps=1e-5):
    N, C, H, W = x.shape
    x = tf.reshape(x, [N, G, C // G, H, W])
    mean, variable = tf.nn.moments(x, [2, 3, 4], keep_dims=True)
    x = (x - mean) / tf.sqrt(variable + eps)
    x = tf.reshape(x, [N, C, H, W])
    return x * gamma + beta