原文链接:点击跳转
文章目录
用于语义分割的带侧抑制的空洞卷积
摘要
空洞卷积可以扩大感受野,不增加而外权重和牺牲空间像素。但是空洞卷积在语义意义轮廓上关于像素的位置知识不能掌握,这可能会导致对象边界的模糊预测。
作者受LI(侧抑制)机制,提出了LI-Convs来克服这些问题。将LI-Convs整合到Deeplab3+结构中,提出了LI-ASPP和LI-MNV2结构。
论文出发点
语义分割是靠边界将不同对象分开,所以边界的像素具有较强的语义信息。然而在空洞卷积中该像素的重要性没有被明确强调,因此这种位置重要性是被隐含地学习,这可能会导致边界标签模棱两可且具有误导性。一些方法已在该方面做出改进,但是仍有提升空间。
虽然空洞卷积可以扩大感受野,但采样像素总数不变。这种稀疏采样某种程度上会削弱语义分割等密集预测任务的潜力。
侧抑制(Lateral Inhibition)是一种神经生物学现象,相近的神经元彼此之间发生的抑制作用,即在某个神经元受到刺激而产生兴奋时,再刺激相近的神经元,则后者所发生的兴奋对前者产生的抑制作用。该机制导致人们视网膜细胞对空间变化的刺激(如物体之间的语义边界)非常敏感。
研究发现LI可以提升神经网络的鲁棒性和效率,但是这些网络结构太浅,对于最新的深层网络结构如MobileNet、ResNet没有效果。LI虽然被引入语义分割,但是前人的工作没有评估LI在语义分割方面的潜力,而他们整合LI的方法并没有触及深层CNN的核心机制,如卷积运算。
Dilated Convolutions with Lateral Inhibitions
Definition
Eq.1定义了一个常规的卷积操作,Eq.2是Eq.1的一个扩展,其中引入了LI项。
L(u,n)代表侧抑制强度,Eq.2可以理解为G(n)特征值减去被抑制的数值,剩余未被抑制的特征值与F(m)做卷积操作。
Eq.3是更泛化的式子,引入了膨胀率e,表示抑制空间的膨胀大小(类似空洞卷积的膨胀),具体请结合Figure.1理解。
Eq.4给出了具体的侧抑制强度表达式,