ResNet----残差结构

一、结构

二、作用

1.在网络继续加深时,在训练集上的效果反而下降,而这不是过拟合引起的,因为过拟合会导致在训练集上效果很好。

2.考虑残差结构的梯度表达式,xl表示该层的输入,xL表示该层的输出。下式最后一项求导的分子和分母写反了

梯度表达式原本是连乘的形式,残差结构相当于将每层里的乘法变成了加法形式,考虑(1+0.01)*(1+0.02)*(1+0.01)...即使0.01部分很小,上述结果依然不导致梯度消失。但如果没了每个括号里的1来做加法,这个式子乘起来就很小。

 

转载于:https://www.cnblogs.com/mimandehuanxue/p/8995223.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值