1、文章信息
作者:高尚华,程明明
单位:南开大学
期刊:IEEE
题目:Res2Net: 一种新的多尺度骨干架构英文原文中文原文
2、背景目的及结论
2.1背景
2.1.1多尺度信息的重要性
1、同一张图片的不同物体会呈现不同的尺寸
2、一个物体的关键上下文语境信息需要从比它本身的所占面积更大的区域提取
3、感知有着不同尺度的物体全部或局部信息有助于细粒度分类和语义分割等任务的性能提升
2.1.2多尺度信息提取的方式
1、卷积神经网络(CNNs)通过堆叠卷积层使得网络由粗到细地学习多尺度特征。
2、后续的增强:如InceptionNets系列在卷积层使用不同大小的卷积核,ResNet使用的残差模块, DenseNet的密集短连接,和DLA 的层次增强。
3、输入不同尺度的数据图像(以上为自己总结,可能并不全面)
2.2目的
对于众多的计算机视觉任务来说,表达出多尺度特征是非常重要的。不过,现存的大多数方法都是通过逐层的方式表达多尺度特征。在本文中,我们为卷积神经网络提出了一种新颖的基础模块,称之为 Res2Net。
2.3结论
Res2Net 可以在更细粒度级别表达多尺度特征,并且可以增加每层网络的感受野大小。
3、结果与讨论
3.1Res2Net
一种更细粒度的级别提升网络的多尺度表达能力的方法
3.2集成先进模块
Res2Net 模块可以与基数(cardinality)维度(用组卷积替换原来的标准卷积)和SE模块一起集成在模型中。
3.3集成到各种模型
实验中使用的 ResNet、 ResNeXt、SE-Net、bLResNet和 DLA都是现在性能一流的网络。相比较于本身就很优秀的基础框架,集成了Res2Net 模块的网络依然可以获得性能的提升。
3.4更深的 Res2Net
在视觉任务中,更深的网络往往有更好的表达能力。文中为了解模型加深后的表现,使用了用101层的Res2Net和ResNet进行物体分类性能的比较
3.5改变尺度(scale)维度
ResNeXt论文中已经验证了增加基数(cardinality)比增加宽度(width)更加有效,所以文中只对比了尺度(scale)维度与基数(cardinality)、深度(depth)
4、文章优点
1、提出了新的维度,做到了在不增加参数量的情况下提升精度
2、探究了Scale和其他维度的关系,其中Scale 更有效
3、实验做的很充分,在保持同等实验条件的前提下,与应用到不同的网络架构做比对实验。
5、总结
1、文中的思想很具有开创性,非常值得学习
2、该模块同时具有很强的适用性,作为子模块,可以很好的应用到各种网络架构中
3、文中提到的Scale维度,可以考虑同Cardinality维度,以及宽度和深度架构,同时应用到了网络架构中
4、同文章中提到的集成优秀架构一样,做实验集成测试,以寻找到更优秀的模型网络
参考文献:
1、Gao S H, Cheng M M, Zhao K, et al. Res2net: A new multi-scale backbone architecture[J]. IEEE transactions on pattern analysis and machine intelligence, 2019, 43(2): 652-662.