AZNet

Adaptive Object Detection Using Adjacency and Zoom Prediction

在本文中,我们建议使用一种自适应地将计算资源定向到可能包含对象的子区域的搜索策略。与基于固定锚点位置的方法相比,我们的方法自然适合对象实例稀疏且小的情况。
我们考虑以下自适应搜索策略。我们的算法不是先固定一组锚区域,而是从整个图像开始。然后递归地将图像划分为子区域(参见图2),直到确定给定区域不太可能包含任何小对象为止。该过程中访问的区域有效地充当了锚点,它们被分配了预测附近对象的边界框的任务。我们算法的一个显著特点是,是否进一步划分一个区域的决策是基于该区域的特征提取。因此,锚点区域集的生成取决于图像内容。对于只有少量小对象的图像,大多数区域在搜索的早期被修剪,在对象附近留下一些小的锚区域。对于只包含大型实例的图像,我们的方法优雅地回到依赖于少量大型锚区域的现有方法。通过这种方式,我们的算法自适应地将其计算资源定向到可能包含对象的区域。

在这里插入图片描述
给定一个输入锚点区域,AZ-Net输出一个标量缩放指示器,该指示器用于决定是否进一步缩放(除)该区域和一组带置信度评分的边界框,或者进行邻接预测。然后利用具有高置信度的邻域预测作为后续目标检测器的区域建议。该网络从整个图像开始递归应用,生成一组自适应的方案。
我们的算法以较快的帧速率实现了接近最先进方法的检测图。代码已在https://github.com/luyongxi/az-net上公开。
我们的目标检测算法由两个步骤组成。在步骤1中,使用自适应搜索和AZ-Net生成一组类无关的区域建议(参见算法1)。在我们的实验中,探测器是Fast R-CNN。我们的重点是改进第一步。我们考虑一个递归搜索策略,从整个图像作为根区域开始。对于搜索过程中遇到的任何区域,该算法都从该区域提取特征,计算缩放指示器和邻接预测。将置信度得分高于阈值的邻接预测包含在输出区域建议集中。如果缩放指示器高于阈值,则表示当前区域可能包含小对象。为了检测这些嵌入的小对象,将当前区域划分为子区域,如图2所示。然后,以与父区域相同的方式递归处理每个子区域,直到其区域或缩放指示器太小为止。图1演示了这个过程。

Design of Building Blocks

在这里插入图片描述
看到这里大家估计就很明白了,和fastrcn基本一致,不同之处在于,放缩指示器用来继续分化区域,训练也很简单,出来普通的rcnn之外,加了个放缩指示器的输出。
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值