41、BatchNorm - 什么是批归一化

最新推荐文章于 2024-07-30 09:45:58 发布

董董灿是个攻城狮

最新推荐文章于 2024-07-30 09:45:58 发布

阅读量394

点赞数 9

分类专栏： CV视觉算法入门与调优文章标签：深度学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dongtuoc/article/details/135042349

版权

CV视觉算法入门与调优专栏收录该内容

93 篇文章 3 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

在 CNN 网络中有一个很重要的技术，叫作批归一化（bn, BatchNorm )。

归一化层一般位于卷积的后面，学术或者工程上，一般习惯将卷积+批归一化+激活统一成一个小的网络结构，比如口语化上称为conv+bn+relu。

这是因为基本上卷积后面肯定会有批归一化，而后面肯定会接激活函数 relu。

为了更贴近实际中的叫法，之后的文章，称批归一化统一称为 BN, 称卷积统一称为 conv, 称池化统一称为pooling。

为什么要有 BN 这个东西

归一化我们都好理解，就是计算出一堆数据的平均值和方差，然后通过减掉均值除以方差的办法，或者其他办法，将所有数据归一化到[0,1]的区间。

那为什么神经网络中也要有归一化呢?

这主要是由于在实际训练过程中，一般都采用多批次进行训练，而多个批次的数据分布并不是完全一致的。

比如我有 1 万张图片用于训练，受限于计算资源或者其他方面的限制，每一次训练我不可能把1万张图片全部喂给神经网络。

大部分的做法是，将1万张训练图片分为10份，每次喂给神经网络1000张图片来进行训练，这1000张图片称为mini-batch，也就是一小批训练数据。

那么问题就来了，我们怎么保证分成的这10份图片训练集中的数据具有相同的分布呢？

举个例子，我们粗浅的用灰度图来表示图片的分布：如果图片大部分为黑色，代表图片数据贴近于0，如果图片大部分为白色，则代表图片数据的分布贴近于 255。关于灰度图的描述可以查看最开始灰度图的章节。

继续假设，第一份中的图片大部分都是黑色系的图片，第二份

了解本专栏

超级会员免费看

董董灿是个攻城狮

关注

9
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
41、BatchNorm - 什么是批归一化

在 CNN 网络中有一个很重要的技术，叫作批归一化（bn, BatchNorm )。归一化层一般位于卷积的后面，学术或者工程上，一般习惯将卷积+批归一化+激活统一成一个小的网络结构，比如口语化上称为conv+bn+relu。这是因为基本上卷积后面肯定会有批归一化，而后面肯定会接激活函数 relu。为了更贴近实际中的叫法，之后的文章，称批归一化统一称为 BN, 称卷积统一称为 conv, 称池化统一称为pooling。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

董董灿是个攻城狮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。