论文原文
0. 简介
DeepLabv2与DeepLabv1非常相似,针对CNN做语义分割的缺点做了些改进:
- 将hole算法(即空洞卷积)引入了CNN中,解决DCNN重复池化下采样导致分辨率大幅下降,位置信息难以恢复的问题;
- 将CRF与DCNN结合,解决由于DCNN的空间不变性导致的分割粗糙,细节信息丢失问题;
- 引入了空洞空间金字塔结构ASPP来融合多尺度的特征图;
DeepLabv2与DeepLabv1主要不同之处在于DeepLabv2利用ASPP模块成功地融合了多尺度信息。而在DeepLabv1中虽然尝试了利用多尺度信息,但效果并没有提升。
1. 网络结构
DeepLabv2整体架构DeepLabv1类似,它的encoder部分基于分类网络VGG-16或ResNet-101实现。
首先将原图经过利用空洞卷积改进的CNN网络下采样到原来图的 1 8 \frac{1}{8}