空洞卷积(dilated convolution)也是一种常见的卷积方式,主要目标是在不提升计算量和降低特征图分辨率的情况下获得更大的感受野。
概念
- 空洞卷积就是在卷积的时候不是对连续的值进行计算,而是会中间隔开几个值,其他与普通的卷积并无差异。可以理解为一个稀疏的大卷积核,只有个别值有效,其余值为零。
作用
- 在不增加计算量和降低特征图分辨率的情况下增大感受野。
问题和解决方法
- 空洞卷积的主要问题也是它的主要特点,就是卷积核不连续,最终可能会导致并非特征图中的所有点都能参与计算,这也会丢失信息的连续性,尤其是对于像素级的任务(如图像分割)来说非常不适用。并且这种设计主要针对在原始图像中占有更多像素点的较大物体,而对于较小的物体可能会失效,因为小物体并不需要较大的感受野。
- 对于上述问题的一种解决方法就是将一组空洞卷积的dilation rate设计成一个没有大于1的公约数的数值,也就是锯齿状的空洞卷积,如[1,2,5,1,2,5]这样的循环结构,这样就可以保证在每一个循环中所有的像素点都能参与计算。
博主会持续更新一些深度学习相关的基础知识以及工作中遇到的问题和感悟,喜欢请关注、点赞、收藏。