Understanding Convolution for Semantic Segmentation
from UCSD & CMU & UIUC & TuSimple
这篇文章提出了对深度语义分割网络的两点改进,包括:
1. 一种高效上采样方法以恢复分割结果的分辨率(Dense Upsampling Convolution, DUC);
2. 一种改进了的洞算法/膨胀卷积操作(Hybrid Dilated Convolution, HDC)。
DUC
与DUC一致的上采样方法最早出现在CVPR 16年的文章“Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network”中。其基本思想是:在网络对特征降采样后,空间特征信息更多地储存在了维度更高的通道(channels)之中,而非单张特征图之中。这一思想也被许多文章所利用,例如检测领域的“End-to-end people detection in crowded scenes”、同为分割领域的“Laplacian Reconstruction and Refinement for Semantic Segmentation”以及其它很多文章。
其具体实现非常简单明了,示意图如下。设需要上采样的倍数为r,当前网络特征图的维度为