读书笔记-Rse2Net

tags: 深度学习;网络结构

Res2net

论文题目《Res2Net: A New Multi-scale Backbone Architecture》 2019.4
论文的主要贡献在于提出了使用更加细粒度的多尺度特征来进行分类、预测等,这样可以增加感受野,提升预测准确率

Res2Net模块

Res2Net模块

Res2Net模块

比如输入图像经过上面的1*1卷积之后,图像大小为w*h*256,那么Res2Net的方法是将这256个通道平均分成比如4组(x1,x2,x3,x4),每组的维度为w*h*64。然后x1直接连接到输出y1,x2在经过3*3的卷积K2之后,得到特征图y2;x3在与y2进行相加后,再经过3*3的卷积核K3,最后输出到y3;x4与y3进行相加后,输出到y4。最终,对获得的特征图y1、y2、y3、y4进行拼接,并使用1*1的卷积核进行特征融合。相比于原始ResNet的一个3*3的卷积操作,这里的操作更加细化,所以也说是细粒度的卷积操作。
这种细粒度操作的好处在于,假如输入的感受野是1,那么y1的感受野也是1,y2 的感受野就变成了3,y3的感受野就是5,y4的感受野就是7(假定stride=1)。也就是说,输出结果y中,包含了不同感受野的特征融合结果。而且,当分组越多,模型的特征提取会更好。

数学化的公式如下:

Res2Net公式表示

Res2Net公式表示

K在这里表示3*3的卷积核

由于这种分解融合的方式对于整体的网络结构并没有太多的依赖性,因此可以将这样的模块嵌入到任何卷积模块中,从而增加特征信息。作者的对比如下:

各模型使用Res2Net模块效果对比

Res2Net公式表示

各任务表现

分类特征激活图

分类特征激活图

显著目标检测图

显著目标检测图

目标分割图

目标分割图
# 参考文献 [Res2Net: A New Multi-scale Backbone Architecture](https://arxiv.org/abs/1904.01169)
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值