倾斜目标矩形框的目标侦测

最新推荐文章于 2023-01-03 18:45:00 发布

「已注销」

最新推荐文章于 2023-01-03 18:45:00 发布

阅读量2.4k

点赞数 3

分类专栏：笔记文章标签：神经网络 pytorch 深度学习

本文链接：https://blog.csdn.net/weixin_48866452/article/details/113586077

版权

本文探讨了在倾斜目标检测中，如何有效地表示和预测目标矩形框。从传统的c_x、c_y、w、h、theta表示到四点坐标标记的方法，分析了不同表示方式的优缺点，包括角度周期性问题和边界问题。还介绍了基于多种角度锚定框和x,y,u,v,s,p参数的解决方案，旨在优化模型训练和提高识别准确性。" 88123935,6563074,Vue中使用npm安装的echarts加载地图指南,"['前端开发', 'Vue', 'Echarts', '地图可视化']

摘要由CSDN通过智能技术生成

1、倾斜目标框

在构建led读数识别时，遇见如下图所示的倾斜的识别对象。

在这里插入图片描述

在标注水平侦测框的时候，是如下图所示标注的。在识别led读数中，会将侦测到的图像部分，resize至具有同样高度的尺寸上，虽然在宽度W维度上，不受限制，但其高度H的信息压缩过多，对数字序列的识别是不利的。

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D2cWGp46-1612318370883)(C:\Users\Jie Xiang\Desktop\images\image-20210203083828964.png)]$

因此，给出这样的一个建议框才是合适的：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-afxYpj5Y-1612318370886)(C:\Users\Jie Xiang\Desktop\images\image-20210203084255618.png)]$

那这样一个目标狂应该如何表示呢？

2、c_x、c_y、w、h、theta

很自然的就会首先想到这样的方案，但是这样表示一个倾斜的目标框是有问题的。

首先是theta角度的周期性，会出现下图的情况，theta加上或者减去2kπ+π⁄2，可以避免角度出现在不应该出现的位置，但是w和h值会互相转换，而网络对应的输出是不应该转换的。对于这样的建议框，网络有多种回归方案，且数值之间的差异大，不利于模型训练。

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nHFO4WGr-1612318370893)(C:\Users\Jie Xiang\Desktop\images\image-20210203085227655.png)]$

3、四点坐标标记

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZNkglDje-1612318370896)(C:\Users\Jie Xiang\Desktop\images\image-20210203085918931.png)]$

网络首先预测的还是（c_x，c_y，w，h）,然后在这样的基础上进行偏移，通过（c_x，c_y，w，h）的矩形框，可算得 $v^{'}_{1}，v^{'}_{2}，v^{'}_{3}，v^{'}_{4})$

最低0.47元/天解锁文章

「已注销」

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
倾斜目标矩形框的目标侦测

1、倾斜目标框在构建led读数识别时，遇见如下图所示的倾斜的识别对象。在标注水平侦测框的时候，是如下图所示标注的。在识别led读数中，会将侦测到的图像部分，resize至具有同样高度的尺寸上，虽然在宽度W维度上，不受限制，但其高度H的信息压缩过多，对数字序列的识别是不利的。因此，给出这样的一个建议框才是合适的：那这样一个目标狂应该如何表示呢？2、c_x、c_y、w、h、theta很自然的就会首先想到这样的方案，但是这样表示一个倾斜的目标框是有问题的。首先是theta角度的周期性，会出现下
复制链接

扫一扫