本文是对语义分割领域的优秀模型DeepLab系列进行的总结。
一、空洞卷积Atrous Convolution
空洞卷积,也称之为膨胀(dilated)卷积,经常用在小波变换上,现在被应用在卷积网络中。空洞卷积的操作与常规卷积相比,多了一个“rate”参数。
上图是1维空洞卷积示例(pad=n表示在左右两边都进行填充n个零输入):
当rate=1时(上图),就是常规卷积,每一个输出特征(绿色)对应三个位置上连续的输入特征,即采样的间隔为0。
当rate>1时(下图),就是空洞卷积,每个输出特征同样对应三个输入特征,但是采样的间隔是1,而且不仅两端有填充,中间也有零填充。
对比可以发现,同样是3个输入特征,常规卷积输出3个,空洞卷积输出5个,故空洞卷积能够扩大特征的尺寸,扩大感受野的范围以处理到更丰富的上下文信息。
下面是特征图尺寸计算公式,W是原尺寸,p是pad填充数,d是膨胀率,k是卷积核尺寸,s是滑动步长。当k=3,s=1,pad=d时,输出尺寸与输如尺寸不变。