CV 经典主干网络 (Backbone) 系列: ResNet家族

CV 经典主干网络 (Backbone) 系列: ResNet家族

作者:Kaiming He 等
发表时间:2015
Paper 原文: Deep Residual Learning for Image Recognition

该篇是 CV 经典主干网络 (Backbone) 系列 下的一篇文章。

ResNet 在 CV 发展史上有非常重要的意义,它在 ImageNet 挑战赛上,首次实现了超越人类的水平。关于 ResNet 的介绍,将分为上下两个部分:

  • ResNet家族:主要介绍原版(凯明大神论文里提出的) ResNet

  • ResNet变种:主要介绍基于ResNet,效果比较好的改进版本

1. 网络结构

ResNet 的核心思想是采用了 identity shortcut connection,如下图一所示。结合下面第二、三幅图来看 ResNet34 的结构应该就非常清晰了。

值得注意的是,下面第二幅图中,shortcut 有虚线和实线之分,实际上虚线的地方是因为用了 stride 为 2 的 conv,因此虚线连接的 input 和 output 的 size 是不一样大的,因此没法直接进行 element wise addition,所以虚线表示并非是直接相连,而是通过了一个 conv 去完成了 resize 的操作,使相加的两个输入有相同的 size。

从下面的第三幅图可以看出 ResNet 的 stride 为 32。.另外如果在输出 size 减小的情况下,比如输入 56x56 的 feature map 下采样到 28时,会相应的增加通道数(64 变为 128),通过这种方式来控制 block 的参数量。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

ResNet 通过 shotcut 的方式,很好的解决了梯度消失的问题,也使网络的层数推到了几百上千层,性能有了巨大的提升,但是和之前的网络相比,比如 VGG16,它仅仅在 classifer 层用了 fc 层,

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值