Abstract
在本文中,我们重温一下Atrous Convolution
的妙用,Atrous Convolution
能在调整滤波器的感受野的的同时,解决DCNNs
造成的分辨率降低的问题。同时,为了解决图像语义分割的多尺度问题,设计了很多模型,包括并行或者串行的使用不同的rate的Atrous Convolution
。更进一步的提出了ASPP
。接下来会详细的说明实现的具体的细节和训练过程,我们的Deeplabv3
在没有Dense crf
的后期处理的条件下取得了非常不错的成绩,达到了state-of-art
。
1. Introduction
对使用DCNNs
进行图片语义分割的任务来说,我们认为主要有两大挑战,第一是由DCNNs
中的下采样(如pooling,convolution stride等)造成的特征图分辨率降低,这种局部的不变性会对密集的预测任务造成干扰,因为丢失了很多空间信息。为了解决这一问题,提出了Atrous Convolution
,也称为Dilated convolution
,被证明对图片语义分割的任务很有效。通过使用Atrous Convolution
,允许我们使用在ImageNet 上预训练好的模型来提取更加密集的特征图,也就是空间分辨率更高的特征图。
第二个则是物体存在的多尺度问题,主要有4种策略来解决这个问题。
如上图所示,第一种办法是对不同的sacle
的image
进行并行的处理,再融合在一起。第二办法是使用编码和解码的对称结构,利用来自编码器部分的多尺度特征并从解码器部分恢复空间分辨率。第三种办法是在原始的网络上级联一些模块,用以捕获更多的信息。第四则是大名鼎鼎的SPP
的使用了。
在级联模块和