残差网络Resnet:Deep Residual Learning for Image Recognition 论文阅读笔记

本文介绍了Resnet论文,探讨网络退化现象及其原因,并提出残差学习模块,通过恒等映射解决梯度消失问题,促进深层网络训练。Resnet通过实验证明了残差模块的有效性,降低模型复杂度的同时提高深度网络性能。
摘要由CSDN通过智能技术生成

Resnet:Deep Residual Learning for Image Recognition

论文传送地址
B站同济子豪兄论文解读

在学习了VGGnet之后,我们知道了利用多个3*3的小卷积核代替大卷积核的方式来进行特征提取,不可避免地模型深度增加了,VGGnet也取得了很大成功,于是前人又开始尝试更深的网络。

随着尝试的深度增加,网络退化(degradation)问题也出现了:

在这里插入图片描述

简单的网络加深并没有提高模型的精度,反而下降了。

造成该现象的原因,这篇文章中,作者也没能给出合理解释,但否定了梯度消失论,作者通过获得BP过程中的梯度的方式,发现深层网络的梯度在反向传播的过程中并没有出现异常,并且一些正则化操作也保证梯度的非0。

question 1:网络退化的具体原因是什么?

为了解决这个问题Resnet引入了残差模块(Residual learing)
y = F ( x , { W i } ) + x y= F(x,\{W_i\})+x y=F(x,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值