参考:
DeepLab V1 V2 V3 V3+及pytorch实现
V1
- DeepLab是针对语义分割任务提出的模型,主要使用了DCNN、CRF、空洞卷积做密集预测。
- DeepLab是结合了深度卷积神经网络DCNNs和概率图模型DenseCRFs的方法。
- DCNNs做语义分割时精度不够,原因是DCNNs的高级特征的平移不变性,也叫作高层次特征映射。平移不变性增强了对数据分层抽象的能力,但是也会阻碍低级视觉任务,例如姿态估计、语义分割等。
- DeepLab解决DCNNs做语义分割准确度不够的解决措施是:将DCNNs层的响应和完全连接的条件随机场CRF结合,同时将hole即空洞卷积应用到DCNNs模型上。
- DCNN深度卷积神经网络在图像标记任务中存在两个技术障碍:一是信号下采样。二是空间不敏感invariance
- 信号下采样的技术障碍涉及到在DCNN中重复最大池化和下采样带来的分辨率下降,这会导致丢失细节。DeepLab采用atrous带孔算法扩展感受野,获取更多的上下文信息。
- 空间不敏感的技术障碍涉及到分类器获取以对象中心的决策是需要空间变换的不变性,这限制了DCNN的定位精度,DeepLab采用完全连接的条件随机场DenseCRF提高模型捕获细节的能力。
- DeepLab用在语义分割上,目的是做逐像素分类。
总结DeepLab v1的模型结构
- 它是一个VGG-16
- 为了使得图像语义分割更准确,5个max-pooling层skip了后面两个(这里不确定是不是准确&#x