BN层的一点总结

I松风水月

已于 2023-03-08 17:00:49 修改

阅读量786

点赞数 1

分类专栏： pytorch 深度学习文章标签：深度学习机器学习人工智能

于 2022-09-29 10:02:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38683460/article/details/127101085

版权

pytorch 同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

在神经网络训练的时候经常会出现训练困难，很难在短时间收敛，这个时候我们通常会想到使用BN层，它能够加快网络的训练收敛速度。接下来我们介绍下什么是BN层，他的原理到底是什么？
一般我们在训练网络的时候损失函数都是用在网络的最后，所以后面的网络训练速度比较快，然而数据是在网络的最前端，导致网络最前端的部分训练比较慢，并且最前端的参数一变网络后面的参数都要变，以及后面的网络传到网络最前端的时候可能会出现梯度消失或者梯度爆炸。
BN层一般用在哪？
答：
全连接和卷积层输出，激活函数前面；全连接和卷积输出上
对于全连接层，作用在特征维度
对于卷积层，作用在通道层
先来看下原文给的公式：
在这里插入图片描述
在训练的时候对每个batch进行标准化，使之满足均值为零，方差为1，然后再在此基础上进行参数 $\gamma$ 和 $\beta$ 的学习。
BN层到底在做什么？

最初的思想是用BN来减少内部协变量转移
后面有论文指出他就是在每个小批量里面加入噪音来控制模型的复杂度
没必要跟Dropout一块使用
可以加快收敛速度，但是一般不改变模型的精度

个人觉得BN做的事情就是先对数据进行标准化，使网络训练简单，然后再加入噪音控制模型的复杂度。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
BN层的一点总结

BN层的一点总结
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

I松风水月 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。