BatchNorm层的作用

最新推荐文章于 2024-05-28 20:54:25 发布

**：天下第一

最新推荐文章于 2024-05-28 20:54:25 发布

阅读量5.5k

点赞数

分类专栏： AI

本文链接：https://blog.csdn.net/u013200703/article/details/92788205

版权

本文探讨了BatchNorm层在神经网络中的作用，指出其规范化过程可能导致数据映射到激活函数的线性区，降低模型表达力。同时，提到在特定任务如图像超分辨率中，去掉BatchNorm层反而能获得更好效果，因为BatchNorm的scale不适合保持图像的绝对差异。此外，由于BatchNorm引入噪声，因此在噪声敏感的任务如强化学习中可能不适用。另外，文章还提到了LayerNorm的一些不适用情况。

摘要由CSDN通过智能技术生成

而第一步的规范化会将几乎所有数据映射到激活函数的非饱和区（线性区），仅利用到了线性变化能力，从而降低了神经网络的表达能力。而进行再变换，则可以将数据从线性区变换到非线性区，恢复模型的表达能力。

代码

def Batchnorm_simple_for_train(x, gamma, beta, bn_param):
"""
param:x    : 输入数据，设shape(B,L)
param:gama : 缩放因子  γ
param:beta : 平移因子  β
param:bn_param   : batchnorm所需要的一些参数
	eps      : 接近0的数，防止分母出现0
	momentum : 动量参数，一般为0.9， 0.99， 0.999
	running_mean ：滑动平均的方式计算新的均值，训练时计算，为测试数据做准备
	running_var  : 滑动平均的方式计算新的方差，训练时计算，为测试数据做准备
"""
	ru

最低0.47元/天解锁文章

**：天下第一

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
BatchNorm层的作用

而第一步的规范化会将几乎所有数据映射到激活函数的非饱和区（线性区），仅利用到了线性变化能力，从而降低了神经网络的表达能力。而进行再变换，则可以将数据从线性区变换到非线性区，恢复模型的表达能力。Batchnorm不适用的情况:韩国团队在2017NTIRE图像超分辨率中取得了top1的成绩，主要原因竟是去掉了网络中的batchnorm层，由此可见，BN并不是适用于所有任务的，在image-to...
复制链接

扫一扫

专栏目录