空洞卷积（Atrous convolution）

Lois_llw

已于 2022-03-31 16:38:25 修改

阅读量992

点赞数 1

分类专栏：深度学习文章标签：机器学习人工智能算法

于 2022-03-27 15:47:13 首次发布

本文链接：https://blog.csdn.net/Lois_llw/article/details/123773747

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

空洞卷积

空洞卷积优点

Dilated Convolution存在的问题

空洞卷积

空洞卷积是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路。利用添加空洞扩大感受野，让原本3x3的卷积核，在相同参数量和计算量下拥有5x5（dilated rate =2）或者更大的感受野，从而无需下采样。

扩张卷积（dilated convolutions）又名空洞卷积（atrous convolutions），向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数，该参数定义了卷积核处理数据时各值的间距。换句话说，相比原来的标准卷积，扩张卷积（dilated convolution）多了一个hyper-parameter（超参数）称之为dilation rate（扩张率），指的是kernel各点之前的间隔数量，【正常的convolution 的 dilatation rate为 1】。

Standard Convolution with a 3*3 kernel Dilated Convolution with a 3*3 kernel

(and padding) and dilation rate 2

之所以提出了Dilated Convolution，是因为Deep CNN存在一些主要的问题：

上采样和池化层存在一些知名的问题（Hinton在演讲中提出）
内部数据结构丢失，空间层级化信息丢失
小物体无法重建

空洞卷积优点

在不做pooling损失信息和相同的计算条件下的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野，但计算资源有限而无法提高卷积核数量或大小时，可以考虑空洞卷积。

Dilated Convolution存在的问题

Dilated Convolution的优点在于可以保留内部数据结构以及可以避免使用下采样这样的特性。但是完全基于Dilated Convilution设计模型也会存在一些问题：

Dilated Convolution的kernel并不连续，也就是并不是所有的像素都用来计算了，因此这里将信息看作checker-board的方式将会损失信息的连续性。(即栅格效应，膨胀卷积不能覆盖所有的图像特征，如下图所示）
Dilated Convolution的设计更像是用于获取long-range information，这样或许对一些大物体有较好的分隔效果，而对于小物体来说可能是有弊无利了。如何同时处理好大小物体的关系，则是设计好dilated convolution网络的关键。

Lois_llw

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
空洞卷积（Atrous convolution）

目录空洞卷积空洞卷积优点Dilated Convolution存在的问题空洞卷积空洞卷积是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路。利用添加空洞扩大感受野，让原本3x3的卷积核，在相同参数量和计算量下拥有5x5（dilated rate =2）或者更大的感受野，从而无需下采样。扩张卷积（dilated convolutions）又名空洞卷积（atrous convolutions），向卷积层引入了一个称为 “扩张率(dilation rate).
复制链接

扫一扫