Group Normalization学习笔记

最新推荐文章于 2022-08-20 18:25:33 发布

心理咨询木木

最新推荐文章于 2022-08-20 18:25:33 发布

阅读量533

点赞数

分类专栏：深度学习文章标签：深度学习归一化学习笔记

本文链接：https://blog.csdn.net/juejing2271/article/details/87623621

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

GN（Group Normalization）出自（FAIR）Facebook AI research，希望使用GN代替深度学习里程碑式的工作BN（Batch normalization）。
本文将分三个部分来慢慢解读GN，做研究一般也是这个顺序。

What
How
Why

第一部分 What

GN是一种新的深度学习归一化方式，可以替代BN。

众所周知，BN是深度学习中常使用的归一化方法，在提升训练以及收敛速度上发挥看重要的作用，是深度学习里程碑式的工作。

第二部分 How

BN、LN、IN和GN

BN在batch的维度上norm，归一化维度为[N,H,W],对batch中对应的channel归一化;
LN避开batch维度，归一化维度为[C,H,W];
IN归一化维度为[H,W];
GN介于LN与IN之间，其首先将channel分为多组，对每组做归一化。先将feature[N,C.H,W]reshape为[N,G,C//G,H,W]，归一化维度为[,C//G,H,W]。

def GroupNorm(x, gamma, beta, G, eps=1e-5):
    # x: input features with shape [N, C, H, W]
    # gamma, beta: scale and offset, with shape [1, C, 1, 1]
    # G: number of groups for GN
    N, C, H, W = x.shape
    X = tf.reshape(x, [N, G, C//G, H, W])
	#对[2,3,4]求均值和方差
    mean, var = tf.nn.moments(X, [2, 3, 4], keep dims=True) 
    X = (X - mean) / tf.sqrt(var + eps)
    X = tf.reshape(X, [N, C, H, W])
    return X * gamma + beta