skip connection

 

skip connections中文翻译叫跳跃连接,通常用于残差网络中。

它的作用是:在比较深的网络中,解决在训练的过程中梯度爆炸梯度消失问题。

 

那么什么是残差块呢?

这个就是残差快,其实就是在神经网络前向传播的时候,考虑第l,l+1,l+2层,a[l]代表第l层的输出,而在一般的神经网络中,需要经过l+1层才能到达l+2层,而残差块中直接将a[l]传出到l+2层,使得a[l+2] = g(z[l+2]+a[l]),其实就是在a[l+2]个激活单元除了与第l+2层的z相关,还与第l层的a相关,这就是跳跃连接。

 

残差块的原理是什么呢?

一个很深的网络,加入残差块后公示为:

a[l+2]=g(z[l+2]+a[l])=g(w[l+2]*a[l+1]+b[l+2]+a[l])

假设梯度消失,则就是w[l+2]=0,此时a[l+2]=g(a[l]),相当于把第l层的输出直接经过relu传输出去,则避免了梯度消失的问题。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值