深度学习：Batch Normalization（BN）

最新推荐文章于 2023-08-07 21:25:59 发布

南淮北安

最新推荐文章于 2023-08-07 21:25:59 发布

阅读量393

点赞数 1

分类专栏：深度学习知识点笔记文章标签：深度学习：Batch Normalization（BN）

深度学习知识点笔记专栏收录该内容

84 篇文章 415 订阅 ¥39.90 ¥99.00

订阅专栏

本文详细介绍了Batch Normalization（BN）算法，探讨了BN在解决深度学习训练中的内部协变量漂移问题，加速训练速度，提高网络泛化能力的作用。BN允许使用较大的学习率，减少对参数调整的依赖，甚至可以替代Drop out和L2正则化。文章还阐述了BN的实现原理，包括BN层的前向和反向传播，以及在卷积神经网络中的应用。

摘要由CSDN通过智能技术生成

文章目录

一、背景

本篇博文主要讲解2015年深度学习领域，非常值得学习的一篇文献：《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》，这个算法目前已经被大量的应用，最新的文献算法很多都会引用这个算法，进行网络训练，可见其强大之处非同一般啊。

近年来深度学习捷报连连、声名鹊起，随机梯度下架成了训练深度网络的主流方法。
尽管随机梯度下降法对于训练深度网络简单高效，但是它有个毛病，就是需要我们人为的去选择参数，比如学习率、参数初始化、权重衰减系数、Drop out比例等。
这些参数的选择对训练结果至关重要，以至于我们很多时间都浪费在这些的调参上。那么学完这篇文献之后，你可以不需要那么刻意的慢慢调整参数。BN算法（Batch Normalization）其强大之处如下：
(1) 你可以选择比较大的初始学习率，让你的训练速度飙涨。以前还需要慢慢调整学习率，甚至在网络训练到一半的时候，还需要想着学习率进一步调小的比例选择多少比较合适，现在我们可以采用初始很大的学习率，然后学习率的衰减速度也很大，因为这个算法收敛很快。当然这个算法即使你选择了较小的学习率，也比以前的收敛速度快，因为它具有快速训练收敛的特性；

(2) 你再也不用去理会过拟合中drop out、L2正则项参数的选择问题，采用BN算法后，你可以移除这两项了参数，或者可以选择更小的L2正则约束参数了，因为BN具有提高网络泛化能力的特性；

(3) 再也不需要使用使用局部响应归一化层了࿰

了解本专栏

南淮北安

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习：Batch Normalization（BN）

文章目录一、背景二、初识BN（Batch Normalization）1、BN概述2、预处理操作选择一、背景本篇博文主要讲解2015年深度学习领域，非常值得学习的一篇文献：《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》，这个算法目前已经被大量的应用，...
复制链接

扫一扫

专栏目录