语义分割丨DeepLab系列总结「v1、v2、v3、v3+」

最新推荐文章于 2024-04-19 16:27:43 发布

woshicver

最新推荐文章于 2024-04-19 16:27:43 发布

阅读量671

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woshicver/article/details/105140867

版权

本文详细梳理了DeepLab系列（v1、v2、v3、v3+）在语义图像分割中的发展，探讨了空洞卷积、条件随机场、ASPP等关键技术及其改进。DeepLabv1引入空洞卷积和CRF，v2采用ASPP增强多尺度信息，v3结合级联ResNet和改进的ASPP，v3+引入编码器-解码器结构与深度可分离卷积，以平衡精度和效率。

摘要由CSDN通过智能技术生成

花了点时间梳理了一下DeepLab系列的工作，主要关注每篇工作的背景和贡献，理清它们之间的联系，而实验和部分细节并没有过多介绍，请见谅。

DeepLabv1

Semantic image segmentation with deep convolutional nets and fully connected CRFs

link:https://arxiv.org/pdf/1412.7062v3.pdf

引言

DCNN在像素标记存在两个问题：信号下采用和空间不变性（invariance）

第一个问题是由于DCNN中重复的最大池化和下采样造成分辨率下降，DeepLabv1通过带孔（atrous）算法解决。
第二个问题是分类器获得以对象为中心的决策需要空间不变性，从而限制了DCNN的空间精度，DeepLabv1通过条件随机场（CRF）提高模型捕获精细细节的能力。

DeepLabv1主要贡献

速度：带孔算法的DCNN速度可达8fps，全连接CRF平均预测只需0.5s。
准确：在PASCAL语义分割挑战中获得第二名。
简洁：DeepLab可看作DCNN和CRF的级联。

相关工作

DeepLab有别于two stage的RCNN模型，RCNN没有完全利用DCNN的feature map。

DeepLab和其他SOTA模型的主要区别在于DCNN和CRF的组合。

方法

空洞卷积

一维空洞卷积

kernel size=3，Input stride=2，stride=1。

理解空洞卷积

feature map变小主要是由于卷积层和池化层引起的，若另所有层的stride=1，输出feature map将会变大。
原始情况下Pooling layer stride=2，receptive field=4

另Pooling layer stride=1，receptive field=3，输出更dense，但感受野变小。

采用空洞卷积后，receptive field=4
跟第一张图相比，在蓝色节点的基础上多了红色节点，在保持感受野使输出更加dense。

条件随机场

全连接CRF模型使用的能量函数E(x)

分为一元势能函‍数‍和二元势能函数。

一元势能函数刻画观测序列对标记变量的影响。

当我们观察到像素点i，是DCNN计算像素i的输出标签的分配概率。

二元势能函数

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。