TensorRT笔记十二（yolov5旋转框检测及部署）

最新推荐文章于 2024-09-13 21:46:52 发布

nanjono

最新推荐文章于 2024-09-13 21:46:52 发布

阅读量1.5k

点赞数 14

文章标签：笔记 YOLO 数学建模

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nanjono/article/details/131327202

版权

一、yolov5_obb

1. 数据集（DOTA数据集）

数据集结构
DOTA:
|____val:
…|_images:
… …|P0001.png
… …|…
…|_labelTxt-v1.5:
… …|_DOTA-v1.5_val_OBB:
… … …|P0001.txt
… … …|…
… …|_DOTA-v1.5_val_hbb:
… … …|P0001.txt
… … …|…
|____train
|____test
其中images文件夹中为图像数据，labelTxt文件夹中为gt_labels文本文件，DOTA-v1.5_val_OBB为有向目标边界框标注，DOTA-v1.5_val_hbb为水平目标边界框标注
共15类目标

classnames_v1_0 = ['plane', 'baseball-diamond', 'bridge', 'ground-track-field', 'small-vehicle', 
                   'large-vehicle', 'ship', 'tennis-court','basketball-court', 'storage-tank', 
                   'soccer-ball-field', 'roundabout', 'harbor', 'swimming-pool', 'helicopter']

2. 旋转框定义方式

使用五参数定义旋转框[x_c, y_c, longside, shortside, Θ]
longside: 旋转矩形框的最长边
shortside: 与最长边对应的另一边
Θ: x轴顺时针旋转遇到最长边所经过的角度，Θ∈[0, 180)

3. detact类

参考[Circular Smooth Label （CSL）]，由于基于回归的旋转框预测方法会产生边界问题，即理想的预测结果超出了我们所定义的范围，导致产生一个较大的损失值，因此将角度的回归问题转换为分类问题。
每个anchor负责预测的参数数量为200=4+1+15+180[x_c, y_c, longside, shortside]+objness+claffications+angels
yolov5_OBB输出为tensor(25200 * 200)

4. 损失函数

损失函数分为四类：置信度损失、class分类损失、θ角度分类损失、bbox边框回归损失

置信度损失：由正样本匹配得到的样本对计算，一是预测框中的目标置信度分数p_0；二是预测框和与之对应的目标框的 iou 值，其作为 ground-truth，两者计算二进制交叉熵BCEWithLogitsLoss得到最终的目标置信度损失。
类别损失：通过预测框的类别分数和目标框类别的 one-hot 表现来计算类别损失，BCEWithLogitsLoss。
θ角度分类损失：类比类别损失。
bbox边框回归损失：如果θ为回归任务，要通过旋转IOU损失函数进行反向传播从而调整自身参数，目前旋转检测器的处理办法为将不可导的旋转IOU损失函数进行近似，使得网络可以正常进行训练。如果将θ转换为分类问题，相当于将角度信息与边框参数信息解耦，旋转框的损失计算部分也分为角度损失和水平边框损失两个部分。

二、tensorrt部署

与yolov5部署不同在于旋转框iou的计算参考了Meta Research的box_iou_rotated实现

其整体实现过程：

结构体定义：

RotatedBox：表示一个旋转框，包含旋转框的中心坐标 (x_ctr, y_ctr)、宽度 w、高度 h 和旋转角度 a。
Point：表示一个点的坐标 (x, y)。

函数 get_rotated_vertices：

输入：一个旋转框 box，以及一个数组 pts 用于存储旋转框的四个顶点。
功能：根据旋转框的中心坐标、宽度、高度和旋转角度，计算旋转框的四个顶点坐标，并存储在数组 pts 中。

函数 dot_2d：

输入：两个二维点 A 和 B。输出：点 A 和点 B 的内积。
功能：计算点 A 和点 B 的二维内积。

函数 cross_2d：

输入：两个二维点 A 和 B。
输出：点 A 和点 B 的二维叉积。
功能：计算点 A 和点 B 的二维叉积，结果可以指定为不同的类型
R。

函数 get_intersection_points：

输入：两个旋转框的顶点数组 pts1 和 pts2，以及一个数组 intersections 用于存储交点。
输出：交点的数量。
功能：计算两个旋转框之间的交点，将交点存储在数组 intersections
中，并返回交点的数量。该函数首先计算两个旋转框的边的向量，然后进行线段相交的检测，将相交的点存储在数组 intersections 中。

函数 convex_hull_graham：

输入：一个点数组 p、点的数量 num_in、一个用于存储凸包点的数组 q，以及一个标志 shift_to_zero。
输出：凸包点的数量。
功能：使用 Graham 扫描算法计算点集的凸包，并将凸包点存储在数组 q中。该函数首先找到点集中的最低点作为起始点，然后将点集中的点减去起始点，进行按角度排序，接着通过栈的方式依次加入点并检查是否形成凹形状，如果是凹形状则将前一个点从栈中弹出，直到得到凸包。最后根据标志shift_to_zero 决定是否将凸包点坐标平移回原点。

函数 polygon_area：

输入：一个凸包点的数组 p 和凸包点的数量 n。
输出：凸包的面积。功能：根据凸包的顶点数组 p 计算凸包的面积。该函数使用 Shoelace 公式（又称为 Gauss 公式）来计算凸包的面积。

函数 rotated_boxes_intersection：

输入：两个旋转框 box1 和 box2。
输出：旋转框的交并比。
功能：计算两个旋转框之间的交并比（IoU）。该函数首先调用 get_rotated_vertices函数获取两个旋转框的顶点数组，然后调用 get_intersection_points函数计算两个旋转框的交点。接着，根据交点数组计算凸包的面积，并分别计算两个旋转框的面积。最后，通过计算两个旋转框面积之和减去交集面积得到并集面积，从而计算交并比。

关注

14
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

nanjono CSDN认证博客专家 CSDN认证企业博客

码龄6年

32: 原创

54万+: 周排名

19万+: 总排名

1万+: 访问

: 等级

378: 积分

38: 粉丝

42: 获赞

9: 评论

105: 收藏

私信

关注

热门文章

最新评论

tensorRT笔记九(int8量化)
WilL846: 不用，直接用FP32的输入就行
tensorRT笔记九(int8量化)
一只程序猿林: 请问您明白了吗，我也有这个问题
tensorRT笔记九(int8量化)
WilL846: 大佬，请问推理的时候输入的数据需要改成int8的吗
TensorRT笔记十二（yolov5旋转框检测及部署）
CSDN-Ada助手: 恭喜您第20篇博客的发布！标题听起来非常有趣，我迫不及待想要阅读您关于TensorRT的最新笔记了。您在yolov5旋转框检测及部署方面的探索无疑将为读者带来新的启发和知识。接下来，我希望您能继续分享更多关于TensorRT的实用技巧和应用案例，这将帮助我们更好地理解和应用该技术。谢谢您的分享，期待您下一篇博客的到来！
numcpp、boost安装配置
Kls200717: 解决了，是boost文件中的lib文件名问题，在 cmakelist文件中 find_package(Boost 1.68.0 REQUIRED 前加如下set(BOOST_ROOT "D:/boost/boost_1_78_0") set(BOOST_INCLUDEDIR "D:/boost/boost_1_78_0/boost") set(BOOST_LIBRARYDIR "D:/boost/boost_1_78_0/stage/lib") set(Boost_LIB_PREFIX "lib") find_package(Boost 1.68.0 REQUIRED

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。