until中物体旋转45度代码_AAAI 2021 | 上海交大等提出R3Det:旋转目标检测网络,代码已开源!...

abf9152b0741a2993f5723e13a22ebf8.png

R3Det 在HRSC2016、DOTA等数据集上无论是准确率还是速率都远超其他方法。

本文转载自:AI科技评论
作者 | Bbuf 责编 | 贾伟

14983dc8af178732ae38a49ef564b525.png

旋转目标检测是一项有挑战性的任务,因为难以定位多角度物体并且与背景准确和快速的分离。虽然已经取得了长足的进步,但在实际设置中,对于大宽高比,密集分布和类别不平衡的旋转目标检测仍然存在困难。

在这篇论文中,提出了一种快速,准确且端到端的的旋转目标检测器。考虑到现有精炼单级检测器的特征未对齐的缺点,这篇论文设计了一个特征精炼模块来获取更准确的特征以提高旋转目标检测性能。

特征精炼模块的关键思想是通过特征插值将当前精炼的边界框位置信息重新编码为对应的特征点,以实现特征重构和对齐。

在DOTA,HRSC2016和ICDAR2015数据集上进行的广泛实验显证明了这种算法的有效性。目前这篇论文的代码已开源,刚刚收录于AAAI 2021。

d674d0d920b9d7e54e3fe5688f0e00cd.png
论文链接: https:// arxiv.org/abs/1908.0561 2
代码地址: https:// github.com/Thinklab-SJT U/R3Det_Tensorflow

注:文末附目标检测和遥感学习交流群

研究背景

目标检测是计算机视觉中的基本任务之一,并且已经有很多高性能的通用目标检测器被提出。当前流行的目标检测器可以分为两种:单阶段和双阶段。双阶段方法在各种基准上取得了可喜的结果,而单阶段的方法则实现了更快的检测速度。然而,当前常规水平目标检测器对于许多实际的应用具有局限性。例如文本检测和遥感目标检测,因为目标可以在任何方向和位置。

因此,在文本检测和遥感目标检测场景中已经提有很多基于一般检测框架的旋转目标检测器被提出。实际上,在文本检测和遥感目标检测领域主要面临三个挑战:

1)大长宽比:对于大长宽比的目标,SkewIOU分数对角度的变化十分敏感,如Figure3所示;

5e08671b443ca75bdeeda0e66e2bef85.png

2)密集排列:如Figure6所示,许多目标通常以密集排列的形式出现;

d16bbe4a8a727ec72e4181a4d8e1043e.png

3)类别不平衡,很多多类旋转目标数据集的类别极度不平衡,如Figure7所示。

68037ef32671de2b7e8357bfdc2200b2.png

在这篇论文中,主要讨论如何设计一个精确且快速的旋转目标检测器。

为了对大长宽比的目标保持较高的定位精度和速度,论文采使用了精炼单级旋转目标检测器。

首先,论文发现旋转锚框(Anchors)可以在目标密集场景发挥更好的效果,而水平锚框可以以更少的数量实现更高的召回率。因此,在本文精炼的单级检测器中使用两种形式的锚框进行组合,即在第一阶段使用水平锚框以提高速度和产生更多候选框。然后在精炼阶段去使用旋转锚框以适应目标密集场景。

第二,论文还指出现有的精炼单级检测器存在特征未对齐的问题,极大的限制了分类和精炼阶段回归的可靠性。本文设

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值