Dilated Conv and Deformable Conv. 空洞卷积和可变形卷积

WeissSama

已于 2023-03-14 15:39:16 修改

阅读量174

点赞数

分类专栏： Deep Learning 文章标签：计算机视觉深度学习神经网络

于 2019-06-15 15:54:38 首次发布

本文链接：https://blog.csdn.net/Bismarckczy/article/details/92093932

版权

Deep Learning 专栏收录该内容

44 篇文章 1 订阅

订阅专栏

空洞卷积论文地址：https://arxiv.org/pdf/1511.07122.pdf
可变形卷积论文地址：https://arxiv.org/pdf/1703.06211.pdf
之前一直知道这两个方法，一直没时间看论文和实现。
后面碰到越来越多这两个知识点，所以记录一下原理。

图像分割的一般流程是先通过pooling或者stride=2的卷积进行下采样得到较小的feature map，得到感受野较大的特征，但是由于图像分割预测是逐像素的输出，所以要将之前较小的feature map再做upsampling上采样，得到原始图像尺寸，再进行逐个像素的预测。

但是不管是avg还是max pooling，在下采样过程中都会损失不少信息，即使将两者结合起来，也难以避免。所以有人提出是否真的需要下采样层？

基于上述疑问，有人提出了空洞卷积Dilated conv，空洞卷积支持感受野指数级增长，同时不会损失图像信息。

有人会说，我们单纯提高卷积核大小，也能够增加感受野大小，但是那样的话，计算量和参数量也会变大。
我们直观看看普通conv和dilated conv。
下图是kernel size=3，stride=2 padding=1的卷积示意图。输入map大小是5，输出是3x3
在这里插入图片描述
下图是kernel size=3，stride=1，dilate rate=2，输入map=7x7，输出map=3x3 .
主要区别就是标准的卷积操作中，卷积核的元素之间都是相邻的。但是，在空洞卷积中，卷积核的元素是间隔的，间隔的大小取决于空洞率。