【AI知识点】批归一化（Batch Normalization）

AI完全体

已于 2024-10-15 09:44:06 修改

阅读量1.7k

点赞数 17

分类专栏： AI知识点文章标签：人工智能机器学习深度学习神经网络归一化梯度消失和梯度爆炸正则化

于 2024-10-07 11:27:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43221845/article/details/142733230

版权

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】

批归一化（Batch Normalization，BN） 是一种用于加速神经网络训练并提高模型稳定性的方法，通过在每一层对神经网络中的激活值进行标准化，使得每一层的输入保持在一个稳定的分布中，从而缓解梯度消失和梯度爆炸的问题，并加快训练过程。

1. 为什么需要批归一化？

在神经网络训练过程中，尤其是深度神经网络，层与层之间的参数不断更新，这导致网络中的每一层的输入分布会发生变化。这种现象被称为内部协变量偏移（Internal Covariate Shift）。它会导致训练变得更加困难，因为每一层的输入分布不稳定，会使得模型需要不断适应新的数据分布，从而影响模型的训练速度。

为了解决这个问题，批归一化被引入。批归一化通过将每一层的激活值标准化为均值为 0、方差为 1 的分布，使得每一层的输入数据保持相对稳定的分布，从而使得网络可以更快地学习和收敛。

2. 批归一化的基本步骤

批归一化的过程主要包括以下几个步骤：

计算批次的均值：
对于每一层的输入（例如激活值） $x$ ，计算其在当前 mini-batch 中的均值：
$\mu_B = \frac{1}{m} \sum_{i=1}^{m} x_i$
其中 $m$ 是 mini-batch 的样本数量， $x_i$ 是第 $i$ 个样本的输入。
计算批次的方差：
接下来计算 mini-batch 中输入的方差：
$\sigma_B^2 = \frac{1}{m} \sum_{i=1}^{m} (x_i - \mu_B)^2$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。