卷积计算公式_吃透空洞卷积(Dilated Convolutions)

最新推荐文章于 2024-04-24 12:00:04 发布

weixin_39695306

最新推荐文章于 2024-04-24 12:00:04 发布

阅读量2.9k

点赞数 1

文章标签：卷积计算公式

本文链接：https://blog.csdn.net/weixin_39695306/article/details/111361985

版权

本文介绍了空洞卷积（Dilated Convolution）的概念，最初为了解决图像分割中保持特征图尺寸不变而增大感受野的问题。空洞卷积通过扩张率参数实现这一目标，且在语音、NLP等领域有广泛应用。文章还探讨了空洞卷积的潜在问题及其解决方案，并提供了感受野的计算方法。

摘要由CSDN通过智能技术生成

一、空洞卷积的提出

空洞卷积中文名也叫膨胀卷积或者扩张卷积,英文名也叫Atrous Convolution

空洞卷积最初的提出是为了解决图像分割的问题而提出的,常见的图像分割算法通常使用池化层和卷积层来增加感受野(Receptive Filed),同时也缩小了特征图尺寸(resolution),然后再利用上采样还原图像尺寸,特征图缩小再放大的过程造成了精度上的损失,因此需要一种操作可以在增加感受野的同时保持特征图的尺寸不变,从而代替下采样和上采样操作,在这种需求下,空洞卷积就诞生了(略有修改,引自[4])

玖零猴：感受野(Receptive Field)的理解与计算@玖零猴@zhuanlan.zhihu.com

当然,如果不用空洞卷积这种方案,那怎么去弥补经过下采样而造成信息损失呢?其实,这是另一个思路了,于是才有了我们熟知的skip connection,它可以为上采样弥补信息,像FCN、U-Net这种典型的拓扑网络,如下图所示,其实我个人认为,如果一个问题如果从不同的思路去想的话,就会出现不同的解决方案

图1 FCN、U-Net典型的分割拓扑结构:下采样、上采样、skip connection(图来自[6])

空洞卷积自2016在ICLR(International Conference on Learning Representation)上才被提出后，本身是用在图像分割领域，但立马被deepmind拿来应用到语音(WaveNet)和NLP领域，它在物体检测也发挥了重要的作用,虽然不要求逐个像素检测,但对于小物体的检测也是十分重要的

二、空洞卷积的原理

与正常的卷积不同的是,空洞卷积引入了一个称为 “扩张率(dilation rate)”的超参数(hyper-parameter)，该参数定义了卷积核处理数据时各值的间距。扩张率中文也叫空洞数(Hole Size)。

在此以

卷积为例,展示普通卷积和空洞卷积之间的区别,如图2所示

图2 普通卷积和空洞卷积的对比(来自[4])

最低0.47元/天解锁文章

weixin_39695306

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
卷积计算公式_吃透空洞卷积(Dilated Convolutions)

一、空洞卷积的提出空洞卷积中文名也叫膨胀卷积或者扩张卷积,英文名也叫Atrous Convolution空洞卷积最初的提出是为了解决图像分割的问题而提出的,常见的图像分割算法通常使用池化层和卷积层来增加感受野(Receptive Filed),同时也缩小了特征图尺寸(resolution),然后再利用上采样还原图像尺寸,特征图缩小再放大的过程造成了精度上的损失,因此需要一种操作可以在增加感受野的同...
复制链接

扫一扫