论文阅读《Rethinking Atrous Convolution for Semantic Image Segmentation》

Deeplab v3

1.Contribution:

这篇论文和deeplab v2相比,contribution不多,主要是在原来的ASPP模块里面加入了bn,同时引入加入了global context来提高ASPP模块的性能。

2.Related work

文章主要还是专注于图像多尺度信息的提取,作者总结了目前流行的4中多尺度信息提取的方法,如下图所示:
d1
第一种用图像金字塔作为输入;
第二种采用encoder-decoder的方式,去年的一篇FPN就是这种方式的典型代表;
第三种采用Atrous convolution的方式,利用不同的dilated rate可以提取不同scale的特征;
第四种采用SPP的方式,这个在目标检测领域比较常见,可以人为控制任意大小输入的feature map经过spatial pooling之后的特征大小

3.Methods

作者主要尝试了两种不同的网络结构:Cascade和Parallel

3.1.Going Deeper with Atrous Convolution

下图表示Cascade的结构,以resnet101为例,resnet101一共有4个block

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值