1.Dilated Convolutions
图像语义分割最核心的两个地方是用pooling下采样减小图像尺寸增大感受野,另一个是用deconv反卷积上采样增大图像尺寸。是用pooling可以增大感受野但是会带来信息损失,若是不用pooling将卷积核变大来增大感受野又会增大参数计算。扩张卷积可以在扩大感受野的情况下不带来多余的参数,它是在原卷积核相邻的元素之间插入参数为零的元素。
原文链接
2.Canny算子中的非极大值抑制(Non-Maximum Suppression)
在canny算子中,非极大值抑制是对单个像素点在0,45,90,135这四个角度方向的梯度相近程度的像素替代。但是实际情况中的梯度方向不至这四个,并且由于图像是用二维数组表示,处于中心位置的像素点沿其梯度方向的相邻像素点可能不存在(亚像素点),故需要对其插值。