《动手学深度学习》第七章——（1）批量归一化

最新推荐文章于 2023-01-09 23:39:48 发布

coder_sure

最新推荐文章于 2023-01-09 23:39:48 发布

阅读量1.9k

点赞数

分类专栏：深度学习文章标签：深度学习批量归一化模型收敛神经网络数据标准化

本文链接：https://blog.csdn.net/weixin_45042017/article/details/123108089

版权

10 篇文章 8 订阅

订阅专栏

前言

训练深层神经网络是十分困难的，特别是在较短的时间内使他们收敛更加棘手。在本节中，我们将介绍批量规范化（batch normalization）也就是BN [Ioffe & Szegedy, 2015]，这是一种流行且有效的技术，可持续加速深层网络的收敛速度。

固定小批量里面的均值和方差
$\begin{aligned} \hat{\boldsymbol{\mu}}_\mathcal{B} &= \frac{1}{|\mathcal{B}|} \sum_{\mathbf{x} \in \mathcal{B}} \mathbf{x},\\ \hat{\boldsymbol{\sigma}}_\mathcal{B}^2 &= \frac{1}{|\mathcal{B}|} \sum_{\mathbf{x} \in \mathcal{B}} (\mathbf{x} - \hat{\boldsymbol{\mu}}_{\mathcal{B}})^2 + \epsilon.\end{aligned}$
然后再做额外的调整（可学习的参数）
$\mathrm{BN}(\mathbf{x}) = \boldsymbol{\gamma} \odot \frac{\mathbf{x} - \hat{\boldsymbol{\mu}}_\mathcal{B}}{\hat{\boldsymbol{\sigma}}_\mathcal{B}} + \boldsymbol{\beta}.$