批量归一化

批量归一化是一种用于深度学习的技术,旨在稳定神经网络中间输出,提高训练效率。它通过在全连接层和卷积层中对输入进行标准化处理,减少内部协变量转移,有助于梯度消失问题的缓解。在全连接层中,批量归一化位于仿射变换和激活函数之间,而卷积层中则在卷积计算后、激活函数前。预测时,批量归一化使用移动平均来估算全局均值和方差。
摘要由CSDN通过智能技术生成

批量归一化(Batch Normalization)

对输入的标准化(浅层模型)

处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。标准化处理输入数据使各个特征的分布相近。

批量归一化(深度模型)

深度模型因为非线性拟合能力实在太强了,随着模型参数的更新,输入可能只发生比较微弱的变化,就会导致中间的输出的取值不太稳定,波动比较剧烈,进而造成越靠近输出层的数据剧烈变化。利用小批量上的均值和标准差,不断调整神经网络中间输出,从而使整个神经网络在各层的中间输出的数值更稳定。

(1)全连接层的批量归一化

位置:全连接层中的仿射变换和激活函数之间。
全连接:u是batch_size*输入神经元个数(仿射变换)---> batch_size*输出神经元个数

批量归一化:故对 x 进行标准化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值