论文阅读:Rethinking Atrous Convolution for Semantic Image Segmentation(DeepLabV3)

1 摘要

目前语义分割过程存在两个问题:① 池化层导致图像分辨率的下降; ② 图像的多尺度问题。针对这两个问题,而在DeepLabV2中,作者提出了带有空洞卷积的ASPP来解决图像的图像分辨率和多尺度问题,而本文中,作者通过对ASPP进行改进得到DeepLabV3网络,没有使用DenseCRF后处理模块,在 PASCAL VOC 2012语义分割数据集中表现SOTA。

2 存在的问题

2.1 解决多尺度问题常用的四个方法

当时常用于解决多尺度的方法有主要四种,如下图:
**加粗样式**
(a)图像金字塔。就是通过输入尺寸不同的图片,这几个图片分别同时放入DCNN中进行处理,再将结果进行融合。而由于每一张尺寸的图片都执行一次DCNN的操作,这样会造成内存资源的消耗,所以在层数很深的DCNN中,由于内存问题受到了限制。

(b)编码器—解码器结构。常见的编码器—解码器结构有U-Net、RefineNet等,SegNet通过引入编码阶段的池化指标,U-Net和RefineNet通过跳跃结构引用编码阶段的特征图。这些结构均是通过在图像解码的时候引入了编码时的特性特征信息而解决多尺度问题。此种方法也在不断地

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值