ANN中批归一化的意义和在SNN中的转化

最新推荐文章于 2023-02-27 09:39:07 发布

华天雪 L.W

最新推荐文章于 2023-02-27 09:39:07 发布

阅读量546

点赞数

分类专栏： python 脉冲神经网络

本文链接：https://blog.csdn.net/huatianxue/article/details/117434798

版权

python 同时被 2 个专栏收录

97 篇文章 6 订阅

订阅专栏

脉冲神经网络

32 篇文章 5 订阅

订阅专栏

批归一化是一个深度神经网络训练的技巧，它不仅可以加快了模型的收敛速度，而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题，从而使得训练深层网络模型更加容易和稳定。所以目前BN已经成为几乎所有卷积神经网络的标配技巧了。

在BN出现之前，对一批数据 ${x_1,x_2……,x_n\}$ ，求均值和方差做归一化。

在这里插入图片描述

1.求每一个训练批次数据的均值 $\mu$
2.求每一个训练批次数据的方差 $\sigma$
3.使用求得的均值和方差对该批次的训练数据做归一化，获得0-1分布。其中ε是为了避免除数为0时所使用的微小正数。
4.尺度变换和偏移：将 $x_i$ 乘以γ调整数值大小，再加上β增加偏移后得到 $y_i$ ，这里的γ是尺度因子，β是平移因子。这一步是BN的精髓，由于归一化后的xi基本会被限制在正态分布下，使得网络的表达能力下降。为解决该问题，我们引入两个新的参数：γ,β。 γ和β是在训练时网络自己学习得到的。

在这里插入图片描述

a中左图是没有经过任何处理的输入数据，曲线是sigmoid函数，如果数据在梯度很小的区域，那么学习率就会很慢甚至陷入长时间的停滞。减均值除方差后，数据就被移到中心区域如右图所示，对于大多数激活函数而言，这个区域的梯度都是最大的或者是有梯度的（比如ReLU），这可以看做是一种对抗梯度消失的有效手段。对于一层如此，如果对于每一层数据都那么做的话，数据的分布总是在随着变化敏感的区域，相当于不用考虑数据分布变化了，这样训练起来更有效率。

BN在深层神经网络的作用非常明显：若神经网络训练时遇到收敛速度较慢，或者“梯度爆炸”等无法训练的情况发生时都可以尝试用BN来解决。同时，常规使用情况下同样可以加入BN来加速模型训练，甚至提升模型精度。

华天雪 L.W

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ANN中批归一化的意义和在SNN中的转化

是一个深度神经网络训练的技巧，它不仅可以加快了模型的收敛速度，而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题，从而使得训练深层网络模型更加容易和稳定。所以目前BN已经成为几乎所有卷积神经网络的标配技巧了。在BN出现之前，对一批数据{x1,x2……,xn}\{x_1,x_2……,x_n\}{x1,x2……,xn}，求均值和方差做归一化。1.求每一个训练批次数据的均值μ\muμ2.求每一个训练批次数据的方差σ\sigmaσ3.使用求得的均值和方差对该批次的训练数据做归一化，获得0-1
复制链接

扫一扫