残差神经网络_【模型篇】解决模型退化——深度残差网络ResNet

ResNet通过残差结构解决深度神经网络的退化问题,确保深层网络至少与浅层网络表现相当。通过恒等映射和跳接操作,即使在网络层数增加时,也能保持模型的有效性,防止梯度消失和过拟合。
摘要由CSDN通过智能技术生成

b7f1b233a35bde363b07bce2d16d9395.png

提出动机

ResNet是为了解决深度神经网络中由于层数过多带来的模型退化问题(degradation)。

一般情况下,模型退化主要有以下几种原因:

  • 过拟合,层数越多,参数越复杂,泛化能力弱
  • 梯度消失/梯度爆炸,层数过多,梯度反向传播时由于链式求导连乘使得梯度过大或者过小,使得梯度出现消失/爆炸,对于这种情况,可以通过BN(batch normalization)可以解决
  • 由深度网络带来的退化问题,一般情况下,网络层数越深越容易学到一些复杂特征,理论上模型效果越好,但是由于深层网络中含有大量非线性变化,每次变化相当于丢失了特征的一些原始信息,从而导致层数越深退化现象越严重。

如下图所示,56层的网络要比20层的网络效果差,出现退化现象。

a08b4f99dcc5051748dbb9898f7f68d5.png

对于深层网络的退化现象,何凯明大神希望用一种方式,使得深层神经网络至少能和浅层神经网络相持平(深层不

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值