rms归一化_Batch Normalization：批量归一化

最新推荐文章于 2024-05-30 18:15:40 发布

justride

最新推荐文章于 2024-05-30 18:15:40 发布

阅读量765

点赞数

文章标签： rms归一化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39654436/article/details/111546748

版权

批量归一化(Batch Normalization)是一种用于加速深度学习模型训练的技术，通过对每一层的输入进行标准化，使其保持均值为0，方差为1的分布，从而减少内部协变量转移，提高训练速度并缓解梯度消失问题。在训练过程中，每个batch的数据会计算均值和方差进行归一化，并在测试阶段使用整个训练集的均值和方差。批量归一化通常位于激活函数之前，有助于确保网络中每一层的输入保持一致分布，提高模型的稳定性和性能。

摘要由CSDN通过智能技术生成

1. 批量归一化(Batch Normalization)：为了让数据在训练过程中保持同一分布，在每一个隐藏层进行批量归一化。对于每一个batch，计算该batch的均值与方差，在将线性计算结果送入激活函数之前，先对计算结果进行批量归一化处理，即减均值、除标准差，保证计算结果符合均值为0，方差为1的标准正态分布，然后再将计算结果作为激活函数的输入值进行计算。

批量归一化的本质：对于每个隐层神经元，把逐渐向非线性函数映射后向取值区间极限饱和区靠拢的输入分布强制拉回到均值为0方差为1的标准正态分布，使得非线性变换函数的输入值落入对输入比较敏感的区域，以此避免梯度消失问题

公式：

均值与方差：是指在训练过程中，每一个批次(batch)的对应位置的均值和方差。训练过程中要分批次训练，划分batch和batch_size。

在训练过程中，计算一个批次中所有图片的每一个位置的元素的均值与方差，一张图片有多少个元素，就有多少个均值与方差。最后得到的均值和方差是用向量的形式表现的

例：一个batch有3个输入，每个输入是一个长度为4的向量

2. 批量归一化的运行：(训练过程中)

对于CNN，一般运算过程是：卷积 - 池化 - 批量归一化 - 激活函数

①输入ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
rms归一化_Batch Normalization：批量归一化

1. 批量归一化(Batch Normalization)：为了让数据在训练过程中保持同一分布，在每一个隐藏层进行批量归一化。对于每一个batch，计算该batch的均值与方差，在将线性计算结果送入激活函数之前，先对计算结果进行批量归一化处理，即减均值、除标准差，保证计算结果符合均值为0，方差为1的标准正态分布，然后再将计算结果作为激活函数的输入值进行计算。批量归一化的本质：对于每个隐层神经元，把...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。