ResNet论文解读

第一次提出残差结构,主要解决两个问题

  • 梯度消失
  • 随着网络深度增加,性能没有提升反而有所下降

如下图,本来要学习H(x),现在转换为F(x)+x,二者效果相同,但是优化难度下降,并且因为多了一个x,使得求导时总有1,避免了梯度消失问题。

f6919003b362c6f76f7fcc9545966d01ce6.jpg

F(X)+X的公式可以通过在前馈网络中做一个“快捷连接”来实现(如图2) ,快捷连接跳过一个或多个层。在我们的用例中,快捷连接简单的执行自身映射,它们的输出被添加到叠加层的输出中。自身快捷连接既不会添加额外的参数也不会增加计算复杂度。整个网络依然可以用SGD+反向传播来做端到端的训练

如果添加的层可以以恒等的方式被构造为自身映射,一个加深的模型的训练误差一定会不大于较浅的对应模型。退化问题表明,求解过程中在使多个非线性层逼近自身映射时有困难。而用残差的方法重构它,如果自身映射达到最佳的,则求解可能仅仅是更新多个非线性层的权值向零去接近自身映射。

残差函数F的形式是灵活的,本文的实验包括了F为2层或3层的情况,虽然更多的层也是可以的,但如果只有一个层(公式1)会等价于一个线性层,y = W1x + x,这样一来就没有可见的优势了。

 

转载于:https://my.oschina.net/u/3858986/blog/2996629

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值