论文阅读:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution,and......

DeepLab系统通过空洞卷积、空洞空间金字塔池化(ASPP)和条件随机场(CRF)改进语义图像分割。空洞卷积增加感受野,ASPP解决多尺度问题,CRF提升边界定位准确性。该方法在多个数据集上表现出色。
摘要由CSDN通过智能技术生成

1 摘要

本文提出了一种用于语义分割的DeepLab系统,主要有三大贡献:① 使用“空洞卷积”代替传统的普通卷积;② 提出空洞空间金字塔池化(ASPP)有效地解决图像多尺度问题;③ 使用条件随机场(CRF)对特征图进行后处理,解决了图像边界定位,分割不准确的问题。DeepLab系统结合DCNN在PASCAL VOC-2012语义分割任务中达到当时最好的效果,在其它的三个数据集:PASCAL-Context,PASCAL-Person-Part,Cityspaces也有很好的表现。

2 亮点

2.1 空洞卷积

在DCNN中,由于需要提高卷积核的感受野以便在每次滑动窗口卷积的时候得到更加丰富的图像语义信息以及语义联系,通常需要对图像进行反复池化和卷积得到一个较小特征图。但是在进行池化的过程中,一些图像的细节信息可能会被池化掉,但是为了提高卷积的感受野同时减少参数,又必须进行池化操作;为了弥补池化带来的信息的丢失,在FCN、U-Net等网络中通过把池化前的特征图与上采样以后得到的特征图进行融合以恢复一些丢失的信息。本文作者想到一个两全其美的办法,就是使用一个叫空洞卷积的东西去代替普通卷积,能够以同样的参数获得更大感受野,每次滑动窗口能整合更多的图像语义信息或者说上下文信息。如下图:
在这里插入图片描述
可见上图中下面移动的为卷积核带有3x3的填充数字,但卷积核不是全填充的ÿ

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值