Batch Normalization层

最新推荐文章于 2024-04-01 13:48:38 发布

Lefenger

最新推荐文章于 2024-04-01 13:48:38 发布

阅读量548

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AbstractSky/article/details/79136727

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Batch Normalization层

我们可以通过标准化输入来避免网络中局部数据十分大或十分小（不在同一个数值范围），同时我们也需要标准化激活函数的输出来保证网络的稳定。
所有网络中都应该使用BN层，他能使网络块10倍,因为学习率可以调大了，且由于不会出现某个值十分大或十分小的情况，曾经许多不能的网络也都可以训练了，
BN能够很好的预防过拟合，因此可以减少Dropout的使用量。
BN层事实上是对上一层的激活层的输出结果进行标准化，即减去均值并除以标准差。但SGD会在训练时Undo这个操作，因此BN采取了如下两种方法来解决：
（1）Add two more trainable parameters to each layer one to multiply all activations to set an arbitrary standard deviation, and one to add to all activations to set an arbitary mean.
（2）Incorporate both the normalization, and the learnt multiply/add parameters, into the gradient calculations during backprop.
举个例子，如果在一个全连接层后面加入BN，假设这个全连接层中有70个神经元，那么BN的参数就是280个，70（实际用于标准化的均值）+70（实际用于标准化的标准差）+70（用于Undo的标准差）+70（用于Undo的均值）
如果想要在已经训练好的网络中加入BN，必须先计算出训练这个网络时所使用的数据集在网络中需要加入BN的前一层的激活值的均值和标准差，并将计算出的值赋到BN的所有参数上（包括实际用于标准化的参数）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Lefenger CSDN认证博客专家 CSDN认证企业博客

码龄10年

64: 原创

18万+: 周排名

224万+: 总排名

22万+: 访问

: 等级

2305: 积分

36: 粉丝

83: 获赞

21: 评论

82: 收藏

私信

关注

热门文章

分类专栏

Unity UI 1篇
Unity Shader 8篇
Unity Main 6篇
思考 4篇
问题集锦 3篇
OpenGL 4篇
机器学习 10篇
Numpy 9篇
Caffe 4篇
Python 5篇
编程 1篇
Opencv 3篇
线性代数 1篇
Keras 5篇
Linux 2篇
Pandas 1篇
微积分 1篇

最新评论

Numpy中的pad函数
lsn2002: 原文没有解释清楚， pad 支持填充行首、行尾，以及帧头、帧尾，所以 pad_width 数据格式是 (before_row, after_row)
关于如何彻底消除unity中的弹力
请用一支玫瑰纪念我回复为食猫: 在Unity2D 项目中，即使设置弹力为0，一个装有碰撞器的物体从空中掉下来，碰撞到地面碰撞器的棱角（比如box 的顶点），是会弹开的
关于如何彻底消除unity中的弹力
Lefenger: 我理解你说的意思了，但我说的只是在unity中使一个刚体自由落体，无论怎么设置参数，刚体都会弹起。你可以试试让一个球自由的落到一个平面上，看看是不是这样，不过这是我三年前写的，现在的版本可能不是这样了
关于如何彻底消除unity中的弹力
为食猫: up主一定是用transform.Translate移动主角...使用刚体力加力推动的话就不会有这个问题... 因为transform.Translate是硬性设置坐标,在高帧数的时候看着以为是移动,其实程序只是在设置坐标,然后在设置坐标以后,才执行碰撞检测.于是就会产生出这个问题. 但使用rigid.AddForce也有很多难处,比如地面摩擦力会导致翻滚或者倒下...如果参照的是控制物体,那么一滚方向就乱了,需要冻结三个旋转轴的物理影响...这样滚动的效果就会消失...不过用模型的话就没关系了.锁就锁吧,直接用模型动画表现滚动就可以了. 我还在学习,我觉得思路应该是适当时候把控制物体扶正...
Caffe中层参数及数据的可视化
维杰太保齐肯: 如果输入是单通道图像呢，求解救

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。