批量正则化Batch Normalization

最新推荐文章于 2023-12-31 01:37:34 发布

纸上得来终觉浅～

最新推荐文章于 2023-12-31 01:37:34 发布

阅读量4.8k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32172681/article/details/99445706

版权

深度学习专栏收录该内容

79 篇文章 8 订阅

订阅专栏

1、为什么随着网络深度增加，神经网络训练越来越慢呢？

因为深层神经网络在做非线性变换前的激活输入值，随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动。训练收敛慢，一般是因为整体分布逐渐往非线性函数的取值区间的上下限两端靠近，这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因。

2、BN（Batch Normalization）的基本思想

BN不仅仅对输入层做标准化处理，还对网络的每一中间层的输入(激活函数前)做标准化处理，使得输出服从均值为0，方差为1的正态分布，从而避免变量分布偏移的问题。之所以称之为批标准化，是因为在训练期间，我们仅通过计算当前层一小批数据的均值和方差来标准化每一层的输入。相当于把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0，方差为1的标准正态分布。

3、Batch Normalization的优点

（1）避免梯度消失和梯度爆炸。把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，这样可以让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

（2）加快训练速度。

（3）提高模型泛化能力。因为批量标准化不是应用在整个数据集，而是mini-batch上，会产生一些噪声，可以提高模型泛化能力。

4、参考文章：

https://blog.csdn.net/mzpmzk/article/details/80043076

https://www.cnblogs.com/carlber/p/10752240.html

纸上得来终觉浅～

关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
批量正则化Batch Normalization

1、为什么随着网络深度增加，神经网络训练越来越慢呢？因为深层神经网络在做非线性变换前的激活输入值，随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动。训练收敛慢，一般是因为整体分布逐渐往非线性函数的取值区间的上下限两端靠近，这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因。2、BN（Batch Normalization）的基本思想BN...
复制链接

扫一扫

专栏目录

纸上得来终觉浅～ CSDN认证博客专家 CSDN认证企业博客

码龄9年

151: 原创

17万+: 周排名

167万+: 总排名

85万+: 访问

: 等级

8452: 积分

212: 粉丝

565: 获赞

113: 评论

3145: 收藏

私信

关注

热门文章

分类专栏

语音识别 52篇
linux 3篇
工作
传统图像处理 13篇
数学 4篇
java 40篇
数据结构与算法 14篇
keras 2篇
ocr 2篇
图像处理 56篇
python 15篇
tensorflow 24篇
深度学习 79篇
机器学习 44篇
pandas 1篇
Kaggle 2篇
paper阅读 21篇
其他 39篇

最新评论

语义分割算法Mask RCNN论文解读
惑许414: Traceback (most recent call last): File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 160, in <module> model = ParallelModel(model, GPU_COUNT) File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 38, in __init__ merged_outputs = self.make_parallel() File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 62, in make_parallel for name, x in zip(self.inner_model.input_names, AttributeError: 'Model' object has no attribute 'input_names' 怎么解决呢请问
python归一化和反归一化
名字都被注册了: 赞同！我的理解是，归一化的数据中每行元素是一个样本，那么每列元素就是不同样本的同一特征。归一化中用到的最大值和最小值是同一特征的。那么最后反归一化的的是n行1列，而不是1行n列，也就是所有样本的y值。这个问题困扰了我很久，希望能对有同样困扰的朋友一些帮助
java常用设计模式
天蓝999: 可以的，我看的另一个神仙级Java设计模式实战，它结合SpringBoot，我彻底学会了Java设计模式及应用，见：https://knife.blog.csdn.net/article/details/131900171
在 Windows 下安装 COCO API（pycocotools）
别偷我的猪_09: 请问，怎么操作呢? 我也遇到了同样的问题
为什么用1*1卷积层代替全连接层？
梧桐细雨绵绵冰: 不同尺寸图像输入，用全连接层的话，只是输入到全连接层的样本数不同吧？还是可以用全连接层吧？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。