DeepLearning:训练神经网络—归一化(Normalization)

最新推荐文章于 2024-05-23 12:49:04 发布

RP_M

最新推荐文章于 2024-05-23 12:49:04 发布

阅读量971

点赞数

分类专栏： CV 深度学习理论 Pytorch 文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43771204/article/details/121340718

版权

训练神经网络—Normalization

文章目录

训练神经网络—Normalization

Normalization出现背景

因为深层神经网络在做非线性变换前的激活输入值随着网络深度加深其分布逐渐发生偏移或变动，导致非线性函数的取值区间在上下限（sigmoid)两端靠近，所以会导致向后传播时底层神经网络的梯度消失，导致训练深层神经网络的收敛速度越来越慢。

Batch Normalization

定义

BatchNorm也称BN层，一般放在非线性层之前，BN层通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布。

公式
$\hat{x}^{\left( \mathrm{k} \right)}=\frac{x^{\left( \mathrm{k} \right)}-E\left( x^{\left( k \right)} \right)}{\sqrt{var\left[ x^k \right]}}$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DeepLearning:训练神经网络—归一化(Normalization)

训练神经网络—Normalization文章目录训练神经网络—NormalizationNormalization出现背景Batch Normalization定义作用BatchNorm:Train-TimeBatchNorm:Test-TimeBatchNorm用于不同网络1.全连接网络中的BatchNorm2.卷积神经网络中的BatchNorm3.循环神经网络中的BatchNorm其它NormalizationInstance NormLayer NormGroup NormGroup NormNo
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。