《Selectivity or Invariance: Boundary-aware Salient Object Detection》笔记

Introduction

该论文利用显著性特征图(saliency feature map)来进行目标检测,得到物体的位置掩膜图(mask),属于显著性目标检测模型(salient object detection, SOD)。

SOD模型在处理物体内部和边界时面临相反的需求。内部的特征应该对强烈的外貌变化具有不变性(invariant)以便突出物体整体。然而边界的特征应该对外貌的轻微变化具有选择性(selective)以便区分物体和背景。

为了解决SOD模型的选择性-不变性(selectivity-invariance)的困境,论文的网络结构分成3个数据流。其中一个数据流是边界位置流(boundary localization stream),用于检测物体的边界,会输出一个边界图(boundary map)。另一个数据流是内部感知流(interior perception stream),用于感知物体的内部区域,会输出一个特征图。这两个数据流的输出图合在一起组成物体的掩膜,但是物体的内部和边界的过渡区域容易分类错误,因此还有第3个数据流。第3个数据流是过渡补偿流,是对过渡区域的分类结果的补偿,用来改善最终的输出结果。这3个数据流的输出结果结合在一起能够得到很好的物体掩膜,如下图所示。
mask效果图

Method

简称论文的方法为BANet,该网络的结构如下图所示,首先是特征提取,然后把不同层的特征输入到3个数据流中,得到3种特征图,最后这3种特征图组合在一起,得到图像中显著性物体的掩膜。
网络结构

以ResNet网络主干为例,主干有5个层次,每个层次的子网络定义为 θ i ( π i ) , i ∈ { 1 , ⋯   , 5 } \theta_i(\pi_i),i\in \{1,\cdots,5\} θi(πi),i{ 1,,5},其中 π i \pi_i πi θ i \theta_i θi的参数。为了不让图片的尺寸下降的太快, θ 4 \theta_4 θ4 θ 5 \theta_5 θ5不会进行下采样,所有卷积层步长变为1,同时分别使用2和4的空洞卷积。

Boundary Localization Stream

边界位置流聚合多层特征,通过上采样和拼接来组合这些特征,具体结构可以看上面的结构图。上采样操作把feature map从原来的 ( H / 8 , W / 8 ) (H/8, W/8) (H/8,W/8)变成 ( H , W ) (H, W) (H,W)。这里使用5种层次的特征,包括低级特征和高级特征,是因为边界检测既需要物体的语义信息,也需要图像的边缘信息。边界位置流的子网络使用 ϕ B ( π B ) \phi_B(\pi_B) ϕB(πB)表示。边界位置流有相应的边界损失函数:

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值