文章目录
1 摘要
目前语义分割过程存在两个问题:① 池化层导致图像分辨率的下降; ② 图像的多尺度问题。针对这两个问题,而在DeepLabV2中,作者提出了带有空洞卷积的ASPP来解决图像的图像分辨率和多尺度问题,而本文中,作者通过对ASPP进行改进得到DeepLabV3网络,没有使用DenseCRF后处理模块,在 PASCAL VOC 2012语义分割数据集中表现SOTA。
2 存在的问题
2.1 解决多尺度问题常用的四个方法
当时常用于解决多尺度的方法有主要四种,如下图:
(a)图像金字塔。就是通过输入尺寸不同的图片,这几个图片分别同时放入DCNN中进行处理,再将结果进行融合。而由于每一张尺寸的图片都执行一次DCNN的操作,这样会造成内存资源的消耗,所以在层数很深的DCNN中,由于内存问题受到了限制。
(b)编码器—解码器结构。常见的编码器—解码器结构有U-Net、RefineNet等,SegNet通过引入编码阶段的池化指标,U-Net和RefineNet通过跳跃结构引用编码阶段的特征图。这些结构均是通过在图像解码的时候引入了编码时的特性特征信息而解决多尺度问题。此种方法也在不断地