BatchNorm的最详细解释和手撕实现与应用代码

SaltyFish_Go

已于 2022-01-27 12:16:48 修改

阅读量4.5k

点赞数 5

分类专栏：动手学深度学习文章标签：概率论机器学习深度学习

于 2022-01-27 12:12:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45169380/article/details/122648965

版权

目录

作用过程：

源起及作用原理：

手写BN代码及作用示例

1、手撕BatchNorm代码

2、应用实例

概述

批量归一化的本质目的：学习底部层的时候避免顶部层变化

所以只有在使用深层的网络结构的时候才会使用BN，浅层的如mlp效果不明显

优点：不会改变模型的精度，但是可以加速模型收敛

首先我们先明确引起变化的原因，是每一层的方差和均值的分布不同。所以我们要固定所有层的分布，尽量符合同一个分布。

批量归一化的作用原理：固定小批量里的均值和方差

1、首先求出均值和方差

2、再做额外的调整，输入的是实际数据xi，输出是归一化后的xi+1，其中gama和beta是可以学习的参数

作用过程：

1、作用在全连接层上时，作用在特征维，对每一列（每一个特征）进行处理，让这一个特征的所有数据均值为零方差为1。

2、作用在卷积层上时，是作用在通道维上面。具体点说，整个批量里所有的像素都是样本，即批量大小*高*宽是样本数，每个通道就是这个样本的一个特征，对这一个批量的一个特征进行批量归一化。是以1*1卷积层为例，得到的每个通道都是每个像素的一个特征。

源起及作用原理：

首先是有人发现这个批量归一化作用在神经网络中非常Work,然后最初的推断是减小了内部协方差转移，但是经过后来的计算，发现并没有（先work后解释？？）后来的论文中指出，

最低0.47元/天解锁文章

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
BatchNorm的最详细解释和手撕实现与应用代码

目录概述作用过程：源起及作用原理：手写BN代码及作用示例1、手撕BatchNorm代码2、应用实例概述批量归一化的本质目的：学习底部层的时候避免顶部层变化所以只有在使用深层的网络结构的时候才会使用BN，浅层的如mlp效果不明显优点：不会改变模型的精度，但是可以加速模型收敛首先我们先明确引起变化的原因，是每一层的方差和均值的分布不同。所以我们要固定所有层的分布，尽量符合同一个分布。批量归一化的作用原理：固定小批量里的均值和方差1、首先求出均值和方差2、.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。