Res2Net:一种新的多尺度主干网络结构
(原论文名:Res2Net: A New Multi-scale Backbone Architecture)
作者:
Shang-Hua Gao∗, Ming-Ming Cheng∗, Kai Zhao, Xin-Yu Zhang, Ming-Hsuan Yang, and Philip Torr
论文下载地址:https://arxiv.org/abs/1904.01169
论文与机翻压缩包下载:https://download.csdn.net/download/qq_35155934/12758756
作者主页
这里附上作者主页下该项目的介绍网址,详细的介绍了该模型的具体应用并公开了相应的代码与流程。
另外,还提供了小demo试试效果,真的很棒!
https://mmcheng.net/res2net/
————————————————————————————
摘要
视觉任务中多尺寸的特征表示十分重要,作为backbone的CNN的对尺寸表征能力越强,性能提升越大。目前,大多数多尺寸的表示方法是layer-wise的。本文提出的Res2Net通过在单一残差块中对残差连接进行分级,进而可以达到细粒度层级的多尺度表征,同时,提高了网络每层的感受野大小。该Res2Net结构可以嵌入到其他网络模型中。
————————————————————————————————————————————————
一、研究背景
在众多视觉任务中,以多种比例表示特征非常重要。多尺度表示对于各种视觉任务至关重要,例如感知目标对象的边界,区域和语义类别。
卷积神经网络(CNN)的最新进展不断显示出更强大的多尺度表示能力,从而在广泛的应用中实现了一致的性能提升。然而,大多数现有方法以分层的方式表示多尺度特征。
在本文中,我们通过在单个残差块内构造分层的类似残差的连接,为CNN提出了一种新颖的构建块。
不同的过滤器组以层级残差式风格连接
模块内部的连接形式与残差网络(ResNet)类似,故命名为Res2Net。
Res2Net在粒度级别表示多尺度功能,并增加了每个网络层的接收范围,计算负载类似。
可以将建议的Res2Net块插入到最新的主干CNN模型中,例如ResNet,ResNeXt和DLA。
(对所有这些模型上的Res2Net模块进行评估,并证明在广泛使用的数据集(例如CIFAR-100和ImageNet)上,与基线模型相比,性能始终保持稳定。 )
————————————————————————————————————————————————————
二、内容概括
文章中介绍了三个部分:
(1)常见主干网络的介绍
Alexnet和VGG要素层的接受域相对固定(堆叠过滤器)
NIN——网络中的网络,1*1卷积核的融合功能
(2)Res2Net模块的介绍
模块结构分析、与流行网络的集成
优点:计算负载不变,性能明显提升
(3) 实验与评估
Pytorch框架下,实现Resnet、ResNEXT、DLA和BLResnet50
ImageNet与CIFAR数据集上的实验结果对比
目标检测、语义分割、实例分割、显著性检测、目标关键点分析
Res2Net能够实现与比以往优秀的基于CNN backbone 的模型(如ResNet,Resnext和DLA)更好的性能表现
————————————————————————————————————————————————
三、常见主干网络的介绍
————————————————————————————————————————————————————————
四、Res2Net模块的介绍
————————————————————————————————————————————————
五、具体实验
(1)保证对比实验的公平!
(2)ImageNet实验
(3)cifar数据集实验
(4)实验-Resnet与Res2net对比(CAM)
(5)实验-Faster-RCNN 目标检测
(6)实验- Deeplab v3 + 语义分割
(7)实验- Mask RCNN实例分割
(8)实验- DSS显著性检测
(9)实验-关键点估计
(10)补充-交互式图像分割
(11)补充-矢量化道路提取
(12)更多补充应用请参考作者网址:
https://mmcheng.net/res2net/
————————————————————————————————————————————————
总结与展望
(另 热腾腾的unet3+的PPT啥的 已经上传啦,可供参考
https://download.csdn.net/download/qq_35155934/12758901
文章与机翻版本:
https://download.csdn.net/download/qq_35155934/12758756
小实例学习: