P6.DeepLabV1网络简介
1.前言
semantic image segmentation with deep convolutional nets and fully connected CRFs
2014 CVPR
https://arxiv.org/abs/1412.7062
语义分割任务中存在的问题:
下采样导致图像分辨率降低——采用空洞卷积
空间不敏感——fully-connected CRF
网络优势:
速度更快,论文中说是因为采用了膨胀卷积的原因,但fully-connected CRFs很耗时
准确率更高,相比之前最好的网络提升了7.2个点
模型结构简单,主要由DCNNs(作为语义分割网络的backbone)和CRFs联级构成
DeepLab的三个重要结构:
DeepLab-MSc(多尺度)-CRF-LargeFOV
2.LargeFOV(Field of View)
在保证mean IOU不下降的前提下减少模型的参数数量,加快模型的训练速度
DeepLab-LargeFOV结构
3.MSc(Multi-Scale)融合多尺度的数据
包含原图尺度数据,前四个maxpooling层的输出数据
不推荐MSc的原因:
增加训练参数数量
增大网络训练时所占用的GPU显存
降低训练和推理的速度