什么是Batch Normalization？

CM莫问

于 2024-12-02 20:11:37 发布

阅读量1.2k

点赞数 21

分类专栏：深度学习人工智能算法常见概念文章标签：人工智能归一化深度学习 python 算法梯度消失梯度爆炸

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ChaneMo/article/details/144194202

版权

一、概念

Batch Normalization是在2015年提出的数据归一化方法，主要用在深度神经网络中激活层之前。它的主要作用是加快模型训练时的收敛速度，使模型训练过程更加稳定，避免梯度爆炸或消失，并起到一定的正则化作用，有时甚至可以替代Dropout。

BN可以应用于全连接层和卷积层，在非线性映射（激活函数）之前对数据进行规范化，使得结果的输出信号的各个维度均值为0，方差为1。这有助于网络的训练，特别是在梯度消失或爆炸的情况下

二、原理

BN的核心思想是让每一层的输入保持一个稳定的分布，这样模型在训练时可以减少对输入分布变化的依赖，从而加速收敛并提升稳定性。具体来说，BN包含以下几个步骤：

1、计算小批量数据的均值和方差

在每一层的输入特征图上，BN会在当前batch的数据上计算其均值和方差。

2、数据归一化

BN对每一个样本的输出进行归一化处理，通过减去均值后再除以标准差，使得归一化后的输出数据具有零均值和单位方差的标准正态分布。

3、缩放和平移

直接归一化会限制模型的学习能力，因为归一化后的输出被严格限制在均值为0和方差为1的分布中。为了恢复模型的表达能力，BN引入了两个可学习的参数：缩放参数γ和偏移参数β，将归一化后的数据进行线性变换：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。