1802.02611:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation
- 属于典型的DilatedFCN,它是Google提出的DeepLab系列的第4弹。
创新点
-
在DeepLab v3上的基础上增加了一个Decoder。
- Decoder将底层特征与高层特征进一步融合,提升分割边界准确度。
- 从某种意义上看,DeepLabv3+在DilatedFCN基础上引入了EcoderDecoder的思路。
-
把backbone从ResNet(DeepLabv3所采用)换成了改进的Xception。
- 改进的Xception主要体现在以下几点:
- 参考MSRA的修改(Deformable Convolutional Networks),增加了更多的层;
- 所有的最大池化层使用stride=2的depthwise separable convolutions替换,这样可以改成空洞卷积;
- 与MobileNet类似,在3x3 depthwise convolution后增加BN和ReLU。
- 使用trimap实验测量模型在分割边界的准确度。计算边界周围扩展频带(称为trimap)内的mIoU。结果如下:
- 采用改进的Xception网络作为backbone,网络变得更快、分割效果上有一定的提升。
- 作者还尝试了在ASPP中加入深度可分离卷积(depthwise separable convolution),发现在基本不影响模型效果的前提下减少计算量。
- 改进的Xception主要体现在以下几点:
性能
- DeepLabv3+在VOC2012测试集上的取得了很好的分割效果: