Dilated Convolution概述
Dilated Convolution是在标准卷积的Convolution map的基础上注入空洞,以此来增加感受野(reception field)。因此,Dilated Convolution在Standard Convolution的基础上又多了一个超参数(hyper-parameter)称之为膨胀率(dilation rate),该超参数指的是kernel的间隔数量。
下面动图解释了膨胀卷积(Dilated Convolution):
之所以提出了Dilated Convolution,是因为Deep CNN存在一些主要的问题:
- 上采样和池化层存在一些知名的问题(Hinton在演讲中提出)
- 内部数据结构丢失,空间层级化信息丢失
- 小物体无法重建
Dilated Convolution存在的问题
Dilated Convolution的优点在于可以保留内部数据结构以及可以避免使用下采样这样的特性。但是完全基于Dilated Convilution设计模型也会存在一些问题:
Dilated Convolution的kernel并不连续,也就是并不是所有的像素都用来计算了,因此这里将信息看作checker-board的方式将会损失信息的连续性。(即栅格效应,膨胀卷积不能覆盖所有的图像特征)
Dilated Convolution的设计更像是用于获取long-range information,这样或许对一些大物体有较好的分隔效果,而对于小物体来说可能是有弊无利了。如何同时处理好大小物体的关系,则是设计好dilated convolution网络的关键。
HDC (Hybrid Dilated Vonvolution)
混合膨胀卷积是针对膨胀卷积存在的问题所提出的,对比膨胀卷积,主要包含以下三方面的特征:
- 叠加的膨胀卷积的膨胀率dilated rate不能有大于1的公约数(比如[2, 4, 6]),不然会产生栅格效应
- 膨胀率dilated rate设计成了锯齿状结构,例如[1, 2, 5, 1, 2, 5]这样的循环结构
- 膨胀率dilated rate需要满足: 其中是第i层的膨胀率dilated rate,是指在i层的最大dilation rate,假设总共有n层,那么.一个简单的例子是:
Dilated Convolution和HDC的对比试验: