Batch Normation

最新推荐文章于 2024-06-07 23:53:23 发布

夏末的初雪

最新推荐文章于 2024-06-07 23:53:23 发布

阅读量731

点赞数 1

分类专栏：论文阅读文章标签： batch normalization BN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27717921/article/details/89040376

版权

之前花费了比较长的时间在论文阅读上，导致最近的博客都没有产出～～

参考论文：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

可以理解为对深层神经网络每个隐层神经元的激活值做简化版本的白化操作

为什么要提出Batch Normation

1. 深度网络的训练速度慢，这是由于Internal Covariate Shift所导致的

Internal Convariate Shift:多层网络训练中,后面层次的神经网络接受到的节点受到前面层次的网络参数变化导致该层输入数据的分布发生了变化.泛指,在多层数据网络中各层之间参数变化引起的数据分布发生变化的现象, 发生在深层网络的隐层.

Internal Convariate Shift导致越到网络深处而导致梯度越小，且梯度下降的方向是东拐拐，西拐拐，从而导致到达最优点的时间越长，爬到山顶越慢。

2. 参数不好调，其中一个参数就是学习率，我们可能要尝试很多次，才能找到合适的学习率，学习率太小，步子太小，训练速度会变慢，学习率过大，又会导致错过最优点。

而Batch Normation的出现就是为了解决1，2问题的，但是问题2出现的本质其实还是由于Internal Convariate Shift所导致的，所以Batch Normation的核心思想其实就是在每一个Layer都进行归一化，将其归一到标准正态分布上。

再说Batch Normation 之前，首先说一下问题1出现的前因后果。

最低0.47元/天解锁文章

夏末的初雪

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Batch Normation

之前花费了比较长的时间在论文阅读上，导致最近的博客都没有产出～～参考论文：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift可以理解为对深层神经网络每个隐层神经元的激活值做简化版本的白化操作为什么要提出Batch Normation1. 深度网络的训...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。