1、图像分割与图像语义分割的区别
传统的图像分割算法基于无监督学习,不知道分割出来的对象的类别。图像语义分割一般基于深度学习,主要是用CNN,也有个别会用到RNN的;此外,图像语义分割属于监督学习的任务,即在训练时会给出每个像素的类别。
2、图像的密集分类问题
语义分割是个密集分类问题,需给每个像素分类,故语义分割和图像分类的目标有较大差异。为了适应这种差异,人们提出了带洞卷积。带洞卷积在语义分割中很受欢迎,因为带洞卷积可以在不扩大滤波器维度的情况下有效地增大感知域。
3、带洞卷积的起源与变异
带洞卷积(dilated convolution),也叫atrous convolution。语义分割中的带洞卷积起源于图像小波分解中的补零滤波器,但语义分割中的带洞卷积不存储零值以减少参数和计算量。
相比于普通的卷积,相同核大小的空洞卷积能有效地扩大感知域(conception field)。dilation rate为1时,等同于普通卷积;dilation rate大于1时,带洞卷积核两点之间间隔dilation rate减1(即下图WaveNet中的Dilation)。
如上图WaveNet所示,卷积核大小不变,当dilation随指数数列增长时,feature map上某一点的感知域也随指数数列增长。
当然空洞卷积可能导致栅格效应: