keras搬砖系列-BN层

keras搬砖系列-BN层

BN层的作用:

1,加速收敛;2,控制过拟合,可以少用Dropout或者不用Dropout;3,降低网络对初始化权重的不敏感;4,允许使用比较大的学习率。

BN层?

批规范化,每次SGD的时候,采用mini-batch的时候对相应的activation做一次规范化,使得结果的均值为0,方差为1,最后的scale and shift 操作则是为了因训练所需刻意加入的BN能够有可能还原最初的输入当的时候,保证了整个网络上的能力。

输入:输入数据x1....xm
计算:1,求数据的均值;2,求数据的方差;3,数据进行标准化;4,训练参数伽马,β;5,输出y通过γ,β的线性变换得到新的值。
正向传播:通过可学习的γ,β参数求出新的分布值。


解决梯度消失与梯度爆炸的问题
1,网络中训练以batch_size为最小单位不断迭代,新的batch_size进入网络,就会产生新的γ与β,在BN层中,有总图片/batch_size组γ与β被保存。
2,图像卷积的过程中,通常使用多个卷积核,得到多张特征图,对于多个卷积核需要保存多个γ与β。


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值