论文阅读：SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS（DeepLabV1）

最新推荐文章于 2024-03-25 19:26:52 发布

旋涡小林

最新推荐文章于 2024-03-25 19:26:52 发布

阅读量508

点赞数

分类专栏：语义分割文献笔记文章标签：计算机视觉人工智能深度学习卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gyyu32g/article/details/104599707

版权

文章目录

1 摘要

深度卷积神经网络（DCNNs）在视觉任务中应用广泛，但是在语义分割中，使用DCNNs的最后一层进行预测存在分割定位不准备的问题。针对这个问题，作者结合DCNNs和CRF概率模型提出一种DeepLab结构，能够解决图像边界分割不清晰的问题，该结构在PASCAL VOC-2012中表现SOTA，达到了71.6% 的IOU。

2 存在的问题

当前的DCNNs主要存在两大问题：
① DCNNs中连续使用池化层会导致图像分辨率变低，使得图像的一些信息不完整。

② DCNNs的细节捕获能力较弱，尤其是目标的边界信息。

3 亮点

3.1 引入空洞卷积

在当时好像也没这么早叫空洞卷积，当时文章写的是引入空洞算法。作者指出，在图像的原始分辨率采用池化层导致在上采样时空间信息稀疏，因此，可以通过2或4的采样率的空洞卷积对特征图做采样扩大感受野，缩小步幅，能够使得特征图更为稠密。因此，作者将VGG16的最后两层的最大池化层使用带填充的空洞卷积替代，文章展示了一维的空洞卷积介绍：
在这里插入图片描述
上图表明，蓝色圈圈的图像的像素，而橙色的圈圈代表的是卷积的结果，可见图像像素是间隔（间隔的地方为空洞）叠加得到一个橙色结果。

3.2 引入CRF处理

针对图像最终的边界分割不清晰、不准确问题，作者使用CRF对图像进行处理，CRF实质是一个概率模型，数学味道比较浓重。全连接的CRF模型使用的能量函数为：
$E(x)=\sum_{i}\theta_{i}(x_{i})+\sum_{ij}\theta_{ij}(x_i,x_j)$
① 各个符号的理解：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS（DeepLabV1）

文章目录1 摘要2 存在的问题3 亮点3.1 引入空洞卷积3.2 引入CRF处理3.3 考虑多尺度处理3.4 总体的结构4 部分结果4.1 分割的数据对比4.2 分割的效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要深度卷积神经网络（DCNNs）在视觉任务中应用广泛，但是在语义分割中，使用DCNNs的最后一层进行预测存在分割定位不准备的问题。针对这个问题，作者结合DCNNs和CRF...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。