CV复习：BatchNorm

我什么都没有3

已于 2022-07-30 16:07:19 修改

阅读量359

点赞数

分类专栏：计算机视觉文章标签：深度学习机器学习人工智能

于 2022-07-30 13:16:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/he_pomelo/article/details/126071074

版权

计算机视觉专栏收录该内容

10 篇文章 0 订阅 ¥199.90 ¥299.90

订阅专栏

超级会员免费看

BatchNorm通过在神经网络中引入可训练的平移和缩放参数，解决了直接归一化导致的特征丢失问题。在训练过程中，它计算批量数据的均值和方差，而在测试时使用预计算的统计值。BatchNorm能够防止梯度消失，加速训练，降低初始化敏感性，并提高网络的泛化能力，从而替代某些正则化技术。

摘要由CSDN通过智能技术生成

BatchNorm的原理

本部分主要结合原论文部分，排除一些复杂的数学公式，对BatchNorm的原理做尽可能详细的解释之前就说过，为了减小Internal Covariate Shift，对神经网络的每一层做归一化不就可以了，假设将每一层输出后的数据都归一化到0均值，1方差，满足正太分布，但是，此时有一个问题，每一层的数据分布都是标准正态分布，导致其完全学习不到输入数据的特征，因为，费劲心思学习到的特征分布被归一化了，因此，直接对每一层做归一化显然是不合理的。

因此，BatchNorm在对数据归一化之后加入了可训练的参数。

这里写图片描述

接下来详细介绍一下这额外的两个参数，之前也说过如果直接做归一化不做其他处理，神经网络是学不到任何东西的，但是加入这两个参数后，事情就不一样了，先考虑特殊情况下，如果

了解本专栏

超级会员免费看

我什么都没有3

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。