论文阅读：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution,and......

最新推荐文章于 2023-07-13 22:20:39 发布

旋涡小林

最新推荐文章于 2023-07-13 22:20:39 发布

阅读量1.4k

点赞数 3

分类专栏：语义分割文献笔记文章标签：计算机视觉深度学习自动驾驶卷积神经网络

本文链接：https://blog.csdn.net/gyyu32g/article/details/104327418

版权

DeepLab系统通过空洞卷积、空洞空间金字塔池化（ASPP）和条件随机场（CRF）改进语义图像分割。空洞卷积增加感受野，ASPP解决多尺度问题，CRF提升边界定位准确性。该方法在多个数据集上表现出色。

摘要由CSDN通过智能技术生成

文章目录

1 摘要

本文提出了一种用于语义分割的DeepLab系统，主要有三大贡献：① 使用“空洞卷积”代替传统的普通卷积；② 提出空洞空间金字塔池化（ASPP）有效地解决图像多尺度问题；③ 使用条件随机场（CRF）对特征图进行后处理，解决了图像边界定位，分割不准确的问题。DeepLab系统结合DCNN在PASCAL VOC-2012语义分割任务中达到当时最好的效果，在其它的三个数据集：PASCAL-Context，PASCAL-Person-Part，Cityspaces也有很好的表现。

2 亮点

2.1 空洞卷积

在DCNN中，由于需要提高卷积核的感受野以便在每次滑动窗口卷积的时候得到更加丰富的图像语义信息以及语义联系，通常需要对图像进行反复池化和卷积得到一个较小特征图。但是在进行池化的过程中，一些图像的细节信息可能会被池化掉，但是为了提高卷积的感受野同时减少参数，又必须进行池化操作；为了弥补池化带来的信息的丢失，在FCN、U-Net等网络中通过把池化前的特征图与上采样以后得到的特征图进行融合以恢复一些丢失的信息。本文作者想到一个两全其美的办法，就是使用一个叫空洞卷积的东西去代替普通卷积，能够以同样的参数获得更大感受野，每次滑动窗口能整合更多的图像语义信息或者说上下文信息。如下图：
在这里插入图片描述
可见上图中下面移动的为卷积核带有3x3的填充数字，但卷积核不是全填充的ÿ

最低0.47元/天解锁文章

旋涡小林

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution,and......

文章目录1 摘要2 亮点2.1 空洞卷积2.2 空洞空间金字塔池化（ASPP）2.3 条件随机场（CRF）3 效果4 结论5 参考文献1 摘要本文提出了一种用于语义分割的DeepLab系统，主要有三大贡献：① 使用“空洞卷积”代替传统的普通卷积；② 提出空洞空间金字塔池化（ASPP）有效地解决图像多尺度问题；③ 使用条件随机场（CRF）对特征图进行后处理，解决了图像边界定位，分割不准确地问题。...
复制链接

扫一扫

专栏目录