空洞卷积Dilated/Atrous Convolution
卷积还没学好,又来一个空洞卷积,慢慢积累吧 o(╥﹏╥)o
空洞卷积广泛应用在语义分割与目标检测等任务中
为什么需要空洞卷积?
以图像分割领域为例,图像输入到CNN中,传统做法就是做卷积再pooling,降低图像尺寸的同时,增大感受野,但是这种方法会导致分辨率下降,会造成一些信息损失
什么是空洞卷积?
就是在普通的卷机基础上,卷积核中间填充0 ,且有两种方法,第一,卷积核填充0,第二 ,输入等间距采样
上面两个图都是第二种方法,第二个图可以看到,
空洞卷积的作用
-
**扩大感受野 ** 空洞卷积感受野大了可以检测到更大的目标,不损失分辨率可以更精确的定位目标
-
捕获多尺度上下文信息:空洞卷积可以设置
dilation rate
, 作用是在卷积核中填充dilation rate
-1个0,因此,当设置不同的dilation rate
时感受野就会不一样,也即获取了多尺度信息
空洞卷积虽然有这么多优点,但在实际中不好优化,速度会大大折扣。
计算问题
以conv size= k*k ,dilation rate = n
就是在卷积核的每两个数字间这塞进入 n-1 个 0
感受野 = (k-1) * n +1 或者 k + (k-1) * (n-1)
感受野卷积核扩张后的大小,并将空位置填充0