论文阅读:Dilated Convolutions with Lateral Inhibitions for Semantic Image Segmentation

在这里插入图片描述

CVPR 2020.6.5

原文链接:点击跳转

用于语义分割的带侧抑制的空洞卷积

摘要

在这里插入图片描述
空洞卷积可以扩大感受野,不增加而外权重和牺牲空间像素。但是空洞卷积在语义意义轮廓上关于像素的位置知识不能掌握,这可能会导致对象边界的模糊预测。

作者受LI(侧抑制)机制,提出了LI-Convs来克服这些问题。将LI-Convs整合到Deeplab3+结构中,提出了LI-ASPP和LI-MNV2结构。

论文出发点

语义分割是靠边界将不同对象分开,所以边界的像素具有较强的语义信息。然而在空洞卷积中该像素的重要性没有被明确强调,因此这种位置重要性是被隐含地学习,这可能会导致边界标签模棱两可且具有误导性。一些方法已在该方面做出改进,但是仍有提升空间。

虽然空洞卷积可以扩大感受野,但采样像素总数不变。这种稀疏采样某种程度上会削弱语义分割等密集预测任务的潜力。

侧抑制(Lateral Inhibition)是一种神经生物学现象,相近的神经元彼此之间发生的抑制作用,即在某个神经元受到刺激而产生兴奋时,再刺激相近的神经元,则后者所发生的兴奋对前者产生的抑制作用。该机制导致人们视网膜细胞对空间变化的刺激(如物体之间的语义边界)非常敏感。

研究发现LI可以提升神经网络的鲁棒性和效率,但是这些网络结构太浅,对于最新的深层网络结构如MobileNet、ResNet没有效果。LI虽然被引入语义分割,但是前人的工作没有评估LI在语义分割方面的潜力,而他们整合LI的方法并没有触及深层CNN的核心机制,如卷积运算。

Dilated Convolutions with Lateral Inhibitions

Definition

在这里插入图片描述
Eq.1定义了一个常规的卷积操作,Eq.2是Eq.1的一个扩展,其中引入了LI项。

L(u,n)代表侧抑制强度,Eq.2可以理解为G(n)特征值减去被抑制的数值,剩余未被抑制的特征值与F(m)做卷积操作。

Eq.3是更泛化的式子,引入了膨胀率e,表示抑制空间的膨胀大小(类似空洞卷积的膨胀),具体请结合Figure.1理解。

在这里插入图片描述
Eq.4给出了具体的侧抑制强度表达式,

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值