Image Segmentation
Fully Convolutional Networks for Semantic Segmentation
CVPR’15
问题
- 这是第一次训练端对端的FCN进行
- 像素级别预测
- 来自监督的预训练
方法
把传统的CNN的FC层换成了卷积层,然后上采样后通过跳接叠加输出
参考
https://arxiv.org/pdf/1411.4038v2.pdf
Multi-Scale Context Aggregation by Dilated Convolutions
ICLR’16
问题
- 图像语义分割问题中下采样会降低图像分辨率、丢失信息
方法
- 提出了膨胀卷积(Dilated Convolution)
收获
- 用膨胀卷积上采样可以在增大感受野的同时保证计算量不变
参考
https://arxiv.org/abs/1511.07122
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
ICLR‘15
问题
- reduced feature resolution,
- existence of objects at multiple scales,
- reduced localization accuracy due to DCNN invariance.
方法
- 对于第一个问题,作者去掉了FCN池化后几层的下采样操作,降低stride并使用hole算法代替上采样。
- 对于第二个问题,作者提出了在卷积操作之前小对给定的feature layer用多种采样率进行 resample
- 即采用多个并行的不同采样率的atrous convolutional layers(ASPP)
- 对于第三个问题,采用一个fully-connected CRF
参考