对空洞卷积的理解

空洞卷积(dilated conv)

对空洞卷积的理解

今天听了一堂关于研究生科学素养的课,老师讲到,当代研究生很多人都只是有输入没有输出,随着时间的流逝,输入的知识也就淡忘了,所以提醒我们,在学习的过程中要有总结和记录,使用各种方法在头脑和电脑上面留下学过的印记,所以我以后都会花时间整理所学知识,相信这是个正确的学习方法。

产生的原因

空洞卷积最初的提出是为了解决图像分割的问题而提出的,常见的图像分割算法通常使用池化层和卷积层来增加感受野(Receptive Filed),同时也缩小了特征图尺寸(resolution),然后再利用上采样还原图像尺寸,特征图缩小再放大的过程造成了精度上的损失,因此需要一种操作可以在增加感受野的同时保持特征图的尺寸不变,从而代替下采样和上采样操作,在这种需求下,空洞卷积就诞生了。

概念

在这里插入图片描述
在普通卷积中间加上空白,就是空洞卷积,其中dilation表示空洞率,也就是卷积核之间的距离。卷积核之间的距离,也即白色方块的个数=dilation-1。灰色方块表示卷积核的权重,白色表示权重为0。
卷积过程如下图:
卷积过从在这里插入图片描述
首先,解释,为什么说空洞卷积增大了感受野?
在这里插入图片描述

a是普通的卷积过程,卷积后的感受野为3。
b是dilation rate = 2的空洞卷积,卷积后的感受野为5。
c是dilation rate = 3的空洞卷积,卷积后的感受野为8。

所以说空洞卷积确实增大了卷积操作之后的感受野。
空洞卷积后的感受野计算公式:k=(n-1)* d - 1
其中,n为原卷积核大小,d为空洞率。

再来解释,为什么说空洞卷积没有改变图片尺寸?
因为卷积后图片的尺寸大小为在这里插入图片描述

其中滤波器大小为(FH,FW),P为填充大小,S为步长。显然,输出图片大小与空洞率等无关,所以输出图片的尺寸不变。

优点

dilated的好处是不做pooling损失信息的情况下,加大了感受野,让每个卷积输出都包含较大范围的信息。

缺点

在这里插入图片描述
虽然空洞卷积增大了感受野,但是,由于空洞卷积的计算方式类似于棋盘格式,某一层得到的卷积结果,来自上一层的独立的集合,没有相互依赖,因此该层的卷积结果之间没有相关性,即局部信息丢失。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值