图像分割网络之空洞卷积理解

最新推荐文章于 2023-02-17 20:40:46 发布

爱学习的人工智障

最新推荐文章于 2023-02-17 20:40:46 发布

阅读量1.9k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_38410551/article/details/90479553

版权

深度学习专栏收录该内容

107 篇文章 51 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了空洞卷积（dilated convolution）的概念，它是为了解决图像分割中信息损失的问题，通过在卷积核中增加间隔来扩大感受野，而不需要经过pooling操作。空洞卷积在保持信息完整性的前提下，让每个卷积输出包含更大范围的信息，广泛应用于图像分割、语音合成和机器翻译等领域。然而，它也存在信息不连续和处理大小物体困难等挑战。文章提到了HDC和ASPP两种使用空洞卷积的方法。

摘要由CSDN通过智能技术生成

预备知识：
感受野定义：卷积神经网络每一层输出的特征图（feature map）上的像素点在原始图像上映射的区域大小，如下图所示。
在这里插入图片描述

空洞卷积背景：起源于图像分割网络。
1.1 传统的做法：图像输入到CNN（典型的网络比如FCN[3]）中，FCN先像传统的CNN那样对图像做卷积再pooling，降低图像尺寸的同时增大感受野，但是由于图像分割预测是pixel-wise的输出，所以要将pooling后较小的图像尺寸upsampling到原始的图像尺寸进行预测，之前的pooling操作使得每个pixel预测都能看到较大感受野信息。
1.2 图像分割FCN的关键：一个是pooling减小图像尺寸增大感受野，另一个是upsampling扩大图像尺寸。
1.3 传统做法的弊端：在先减小再增大尺寸的过程中，肯定有一些信息损失掉了。那么能不能设计一种新的操作，不通过pooling也能有较大的感受野看到更多的信息呢？答案就是dilated conv&#x

了解本专栏

超级会员免费看

爱学习的人工智障

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
图像分割网络之空洞卷积理解

预备知识：感受野定义：卷积神经网络每一层输出的特征图（feature map）上的像素点在原始图像上映射的区域大小，如下图所示。空洞卷积背景：起源于图像分割网络。1.1 传统的做法：图像输入到CNN（典型的网络比如FCN[3]）中，FCN先像传统的CNN那样对图像做卷积再pooling，降低图像尺寸的同时增大感受野，但是由于图像分割预测是pixel-wise的输出，所以要将pooling...
复制链接

扫一扫

专栏目录