ICCV 2019 | 可选择性与不变性:关注边界的显著性目标检测

本文介绍了ICCV 2019的论文BANet,它通过边界定位、内部感知和转变补偿分支解决显著性目标检测中的可选择性与不变性问题。BANet采用ResNet-50作为backbone,并利用ISD模块增强特征不变性。实验结果显示,BANet在保持高精度的同时,与BASNet相比,具有不同的优势和特点。
摘要由CSDN通过智能技术生成

640

作者丨文永亮

学校丨哈尔滨工业大学(深圳)硕士生

研究方向丨目标检测、GAN


概要

上一次我们介绍了 CVPR 2019 的 BASNet,CVPR 2019 的那篇 BASNet 主要通过引入结构相似性损失640?wx_fmt=png使网络更关注边界。这次的 ICCV 2019 有一篇“撞车”论文,可选择性与不变性之关注边界的显著性目标检测(文中称其网络为 BANet),是北航、北大和深圳鹏城实验室的文章。


640?wx_fmt=png

640?wx_fmt=png


其实比引入关注边界的 loss 更加暴力,它的亮点就在于直接增加一条分支网络提取预测边界,后面结合显著性目标的内部共同组成特征做监督训练。在效果方面其实两篇关注边界的都相差不大,MAE 方面似乎 BANet 要比 BASNet 低一点,但是 Fβ 的评价下,BASNet 要比 BANet 要高一点。

两个问题


640?wx_fmt=png

 Fig 1. 不同区域的显著性检测需要不同的特征

SOD(Salient Object Detection)是关于人眼注意的显著性物体的任务,存在着两个问题:

  • 一个大的显著性物体内部存在很大的外观变化导致很难当做一个完整的物体,如 Fig1 中的 (a) 和 (b);

  • 显著性物体的边界很混杂很难从周围背景中分辨出来,如 Fig1 的 (c) 和 (d)。

其实这就关系到了一个 Selectivity-Invariance dilemma,就是可选择性与不变性的困境,用传统的分类任务来理解,就是同一只狗在不同背景下差别很大,而在相同背景下狗和狼的差异不大,想要把前一组图片中的狗放在一个类别,就是 Selectivity-Invariance dilemma


这时候的解决方法就是需要一组特征,能够选择性的响应图片中的重要部分,而对图片中的不重要部分的变化保持不变性。这对特征的划分要求很高,如果想让网络完全学出来响应变化可能会导致网络十分敏感,对不重要部分变化(如背景的改变)产生很大反应。


模型架构

640?wx_fmt=png

 Fig 2. BANet 的网络结构

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值