Dilated/Atrous Convolution（空洞卷积）

最新推荐文章于 2024-03-12 19:11:23 发布

xiaochengJF

最新推荐文章于 2024-03-12 19:11:23 发布

阅读量785

点赞数

分类专栏：目标检测文章标签：深度学习目标检测计算机视觉卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43711554/article/details/104624968

版权

目标检测专栏收录该内容

41 篇文章 1 订阅

订阅专栏

论文1：MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS（ICLR 2016）
论文2：Understanding Convolution for Semantic Segmentation（CVPR 2018）

文章目录

动机

传统的网络结构通常用一系列Pooling操作降低分辨率（分辨率低，通道数不变的话，后面计算量会更少），增加感受野（提取多尺度特征），但Pooling操作会丢失许多局部的信息，这对于需要精确定位的任务，尤其分割任务是不利的，因为分割任务中采样后通常还有一个恢复分辨率的过程

于是就有了Dilated Convolution：聚合多尺度上下文信息（感受野）而不丢失分辨率信息

Dilated Convolution

Dilated Convolution其实就是在标准卷积中填充0，普通卷积可以看成是Dilated Convolution的特例，以下图 3×3 卷积为例：

a：标准 3×3 卷积，与红色点对应，感受野 3×3
b： 3×3 的 2-dilated conv，每个红点周围都填充零，感受野瞬间 7×7
c：与 b 一样，只是感受野更大

在这里插入图片描述
Dilated Convolution实现方式可以有两种：

卷积核填充 0
等间隔采样

Context Network

在这里插入图片描述
效果还是不错的

在这里插入图片描述

棋盘效应

Dilated Convolution kernel 并不连续，意味着

同样会忽略掉一些位置的信息
位置相差较远时，像素点间相关性较低

举个极端的例子：特征图大小 5×5，用 3×3 的 2-dilated conv，白色部分的像素就被忽略了
在这里插入图片描述

所以只采用大 dilation rate conv ，对小目标的检测效果可能不佳，因为丢失了较多细节，很多像素点被忽略，容易形成棋盘效应：
在这里插入图片描述

HDC

HDC(Hybrid Dilated Convolution)：混合不同 rate 的 Dilated Convolution 卷积层，使卷积计算覆盖整个区域，混合原则：

dilation rate 公约数不能大于1
满足 $M_i\leq k$ ，其中 $k$ 表示卷积核大小， $[r_1, r_2, \cdots,r_i]$ 为 HDC 每层的dilation rate， $M_i$ 由下式得到：

HDC可以像模块一样搭建，如下图：
在这里插入图片描述

DUC 为 Dense Upsampling Convolution：将 $\frac Wd\times \frac Hd \times C$ 特征图通道增加到 $\frac Wd\times \frac Hd \times (C\times d^2)$ ，然后用 reshape 代替常规的 Upsampling 操作，将特征图变换回 $C$ 通道： $W\times H \times C$ ，尺寸与 mask 标签匹配

参考文献

【1】总结-空洞卷积(Dilated/Atrous Convolution)
【2】Dilated Convolutions（空洞卷积）
【3】Understanding Convolution for Semantic Segmentation
【4】[基础知识整理] 空洞卷积(Dilated/Atrous Convolution)
【5】感受野
【6】语义分割–Understand Convolution for Semantic Segmentation

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。