图像分割网络之空洞卷积理解

本文介绍了空洞卷积(dilated convolution)的概念,它是为了解决图像分割中信息损失的问题,通过在卷积核中增加间隔来扩大感受野,而不需要经过pooling操作。空洞卷积在保持信息完整性的前提下,让每个卷积输出包含更大范围的信息,广泛应用于图像分割、语音合成和机器翻译等领域。然而,它也存在信息不连续和处理大小物体困难等挑战。文章提到了HDC和ASPP两种使用空洞卷积的方法。
摘要由CSDN通过智能技术生成

预备知识:
感受野定义:卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小,如下图所示。
在这里插入图片描述

  1. 空洞卷积背景:起源于图像分割网络。
    1.1 传统的做法:图像输入到CNN(典型的网络比如FCN[3])中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预测是pixel-wise的输出,所以要将pooling后较小的图像尺寸upsampling到原始的图像尺寸进行预测,之前的pooling操作使得每个pixel预测都能看到较大感受野信息。
    1.2 图像分割FCN的关键:一个是pooling减小图像尺寸增大感受野,另一个是upsampling扩大图像尺寸。
    1.3 传统做法的弊端:在先减小再增大尺寸的过程中,肯定有一些信息损失掉了。那么能不能设计一种新的操作,不通过pooling也能有较大的感受野看到更多的信息呢?答案就是dilated conv&#x
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值