[论文笔记] Oriented R-CNN 阅读笔记

吉他A梦

已于 2022-08-11 08:23:12 修改

阅读量661

点赞数

分类专栏：论文笔记文章标签： cnn 深度学习人工智能

于 2022-08-11 08:20:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44690067/article/details/126274539

版权

论文笔记专栏收录该内容

32 篇文章 2 订阅

订阅专栏

Oriented R-CNN 阅读笔记

Oriented R-CNN for Object Detection（ICCV 2021）

Oriented R-CNN for Object Detection（ICCV 2021）

论文链接：论文链接
代码链接：代码链接

摘要

传统two-stage检测器通过产生oriented proposals来进行OBB检测，十分耗时
Oriented R-CNN是一个two-stage检测器：第一个stage使用oriented RPN产生高质量OBB；第二个stage是oriented R-CNN head用来细化oriented RoIs并进行识别
DOTA上75.87%mAP，HRSC2016 96.50%mAP，1024×1024图片在RTX 2080Ti上有15.1FPS

引言

产生oriented proposals的三种方案

Oriented R-CNN

在这里插入图片描述

Oriented RPN

编码：Oriented RPN 网络输出 offset $\delta=(\delta_x,\delta_y,\delta_w,\delta_h,\delta_\alpha,\delta_\beta)$ ，因此特征图上的每一个点有 6A 个输出（A是每个点上的anchor数目）
解码：（所有的参数含义可以从上面那张结构图里面知道）

Midpoint Offset Representation

在这里插入图片描述

在这里插入图片描述

Loss Function

$p^*\in \{0,1\}$ 表示每一个anchor属于一个正样本或者负样本， $p^*_i$ 表示该anchor对应的gt的真实label， $\delta_i$ 和 $t^*_i$ 分别表示预测的OBB和真实的OBB

在这里插入图片描述

获得的预测box可能带有仿射变换，如下图

Oriented R-CNN Head

Rotated RoIAlign

将上述蓝色框较短的对角线延长至和较长对角线一样的长度，得到一个矩形框

在这里插入图片描述

将oriented rectangular投影到stride为 $s$ 的特征图 $F$ 上，然后通过RoI操作进行特征提取得到最右边的规格为 $m \times m$ 的特征图 $F^{'}$ （ $m$ 默认为7）
特征图 $F^{'}$ 的第 $c$ 通道上的点 $(i, j)$ 用以下公式计算
其中 $F_c$ 是第 $c$ 个通道的特征， $n$ 是每个网格内定位的样本数， $a re a (i, j)$ 是包含在索引 $(i, j)$ 的网格中的坐标集， $R (\cdot)$ 是一个旋转变换

实验结果

召回率

分别在每张图片中选择top-300、top-1000、top-2000个最高得分的proposals用 $R_{300}、R_{1000}、R_{2000}$ 表示，结果如下图

DOTA数据集上与SOTA的对比

在这里插入图片描述

HRSC2016数据集上与SOTA的对比

在这里插入图片描述

DOTA数据集上速度与准确率对比

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[论文笔记] Oriented R-CNN 阅读笔记

Oriented R-CNN使用Oriented RPN和Oriented R-CNN head来获得Oriented OBB，准确率获得了SOTA的级别，同时可以达到15.1FPS的检测速度
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。