CNN-batch normalization讲解

最新推荐文章于 2023-02-15 15:47:00 发布

littletomatodonkey

最新推荐文章于 2023-02-15 15:47:00 发布

阅读量5.2k

点赞数 2

分类专栏：深度学习文章标签： batch normalization 深度学习归一化

本文链接：https://blog.csdn.net/u012526003/article/details/83015367

版权

深度学习专栏收录该内容

40 篇文章 1 订阅

订阅专栏

batch normalzation

introduction

BN主要是为了解决NN训练过程中难以收敛的问题，可以在一定上推迟过拟合的发生（注意：有些博客中说BN可以防止过拟合，但是论文（https://arxiv.org/pdf/1611.03530.pdf）中验证了BN只是有抑制作用，使得过拟合在更多的epoch之后出现，但是并不能阻止）
在机器学习过程中，最理想的状态就是特征或者数据是独立同分布的，因此在数据预处理的时候，一般会使用PCA或者normalization方法去规范化数据，使得模型易于训练。
下图是CNN训练中常用的normalization方法，一般每层feature map的尺寸是 $(N X C X H X W)$ 。其中BN是对每个batch中的每个channel中的所有值进行单独处理，最终可以得到C个mean与C个var的值。其他的normalization方法与特定的数据维度可以参见下图。

在这里插入图片描述

注意：CNN中的normalization方法与regularization方法是不同的，一个是正规化，一个是正则化，
regularization是防止过拟合，normalization是为了规范数据的分布，便于后续的训练过程。

比较好的参考链接：https://zhuanlan.zhihu.com/p/33173246

简介

在训练的过程中，BN是首先计算当前channel中所有值得均值与方差，然后对其进行归一化，为了防止这种归一化使得数据丢失学习到的特征，BN又添加了2个可以学习的值，使得归一化的值可以有不同的变化。主要的公式如下

$\begin{array}{l} {\mu _B} = \frac{1}{m}\sum\limits_{i = 1}^m {{x_i}} \\ \sigma _B^2 = \frac{1}{m}\sum\limits_{i = 1}^m {({x_i} - } {\mu _B}{)^2}\\ {{\hat x}_i} = \frac{{{x_i} - {\mu _B}}}{{\sqrt {\sigma _B^2 + \varepsilon } }}\\ {y_i} = \gamma {{\hat x}_i} + \beta = B{N_{\gamma ,\beta }}({x_i}) \end{array}$

在测试的时候，一般都是一张图像，没有batch size的概念，无法在测试数据中获取原始数据的均值与方差，因此我们可以记录训练样本中的值，相当于假设每批训练样本中的均值和方差都是固定不变的，因此在测试阶段的 $\mu$ 与 $\sigma$ 的计算公式如下。

$\begin{array}{l} E[x] = {E_B}[{\mu _B}]\\ var[x] = \frac{m}{{m - 1}}{E_B}[\sigma _B^2] \end{array}$

上面计算结果是均值和标准差的无偏估计。

最后BN的使用公式就是

$\frac{\gamma }{{\sqrt {{\mathop{\rm var}} [x] + \varepsilon } }}x + (\beta \frac{{\gamma E[x]}}{{\sqrt {{\mathop{\rm var}} [x] + \varepsilon } }})$

注意

在训练和测试的过程中，BN的使用稍有不同，但是原始公式都是相同的，造成差异的原因是训练和测试数据的不同。

littletomatodonkey

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
CNN-batch normalization讲解

batch normalzationintroductionBN主要是为了解决NN训练过程中难以收敛的问题，可以在一定上推迟过拟合的发生（注意：有些博客中说BN可以防止过拟合，但是论文（https://arxiv.org/pdf/1611.03530.pdf）中验证了BN只是有抑制作用，使得过拟合在更多的epoch之后出现，但是并不能阻止）在机器学习过程中，最理想的状态就是特征或者数据是独...
复制链接

扫一扫