[论文笔记] Oriented R-CNN 阅读笔记

Oriented R-CNN for Object Detection(ICCV 2021)

论文链接:论文链接
代码链接:代码链接

摘要

  • 传统two-stage检测器通过产生oriented proposals来进行OBB检测,十分耗时
  • Oriented R-CNN是一个two-stage检测器:第一个stage使用oriented RPN产生高质量OBB;第二个stage是oriented R-CNN head用来细化oriented RoIs并进行识别
  • DOTA上75.87%mAP,HRSC2016 96.50%mAP,1024×1024图片在RTX 2080Ti上有15.1FPS

引言

  • 产生oriented proposals的三种方案
    在这里插入图片描述

Oriented R-CNN

在这里插入图片描述

Oriented RPN

  • 编码:Oriented RPN 网络输出 offset δ = ( δ x , δ y , δ w , δ h , δ α , δ β ) \delta=(\delta_x,\delta_y,\delta_w,\delta_h,\delta_\alpha,\delta_\beta) δ=(δx,δy,δw,δh,δα,δβ),因此特征图上的每一个点有 6A 个输出(A是每个点上的anchor数目)
  • 解码:(所有的参数含义可以从上面那张结构图里面知道)在这里插入图片描述
Midpoint Offset Representation

在这里插入图片描述

在这里插入图片描述

Loss Function
  • p ∗ ∈ { 0 , 1 } p^*\in \{0,1\} p{0,1} 表示每一个anchor属于一个正样本或者负样本, p i ∗ p^*_i pi表示该anchor对应的gt的真实label, δ i \delta_i δi t i ∗ t^*_i ti分别表示预测的OBB和真实的OBB
    在这里插入图片描述

在这里插入图片描述

  • 获得的预测box可能带有仿射变换,如下图
    在这里插入图片描述

Oriented R-CNN Head

Rotated RoIAlign
  • 将上述蓝色框较短的对角线延长至和较长对角线一样的长度,得到一个矩形框

在这里插入图片描述

  • 将oriented rectangular投影到stride为 s s s 的特征图 F F F 上,然后通过RoI操作进行特征提取得到最右边的规格为 m × m m×m m×m 的特征图 F ′ F' F m m m 默认为7)
  • 特征图 F ′ F' F 的第 c c c 通道上的点 ( i , j ) (i, j) (i,j) 用以下公式计算在这里插入图片描述
    其中 F c F_c Fc 是第 c c c 个通道的特征, n n n 是每个网格内定位的样本数, a r e a ( i , j ) area(i,j) area(i,j)是包含在索引 ( i , j ) (i,j) (i,j) 的网格中的坐标集, R ( ⋅ ) R(·) R() 是一个旋转变换

实验结果

召回率

  • 分别在每张图片中选择top-300、top-1000、top-2000个最高得分的proposals用 R 300 、 R 1000 、 R 2000 R_{300}、R_{1000}、R_{2000} R300R1000R2000 表示,结果如下图
    在这里插入图片描述

DOTA数据集上与SOTA的对比

在这里插入图片描述

HRSC2016数据集上与SOTA的对比

在这里插入图片描述

DOTA数据集上速度与准确率对比

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值