对象检测与摄影测量：End To End 9DPose Object Detection【方法解析】

沉浸式AI

已于 2024-08-03 21:10:29 修改

阅读量49

点赞数

分类专栏：《AI与SLAM论文解析》文章标签：人工智能计算机视觉深度学习目标检测姿态检测摄影测量

于 2024-07-24 21:26:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_39783664/article/details/140673663

版权

《AI与SLAM论文解析》专栏收录该内容

45 篇文章 0 订阅 ¥299.90 ¥399.90

订阅专栏

中文标题：端到端9DPose对象检测

目录

摘要

现有的单目视觉3D物体识别方法通常仅使用偏航角（Yaw）来描述物体的姿态，这不足以表达物体可能表现出的各种姿态，如物体的侧向旋转。而且，目前大多数物体识别模型都转换为关键点检测或NOCS地图检测，然后基于PnP预测目标的6D姿态。这种非端到端的姿态预测方法不仅增加了不稳定性，还导致推理效率非常低下。

本文提出了一种端到端的9DPose物体识别模型（3D位置 + 3D姿态 + 3D目标大小），以解决这两个问题。该模型利用单个2D图像同时识别场景中多个物体的3D位置、姿态和大小，有效地捕捉具有三自由度旋转的物体。我们发现了一种非常有效的四元数损失定义方法，能够非常准确地表征姿态误差，为端到端9DPose的实现奠定了基础。我们的方法结合了四元数损失和Rd虚拟坐标系转换技术，能够准确回归物体的3D姿态，显著提高了物体检测的准确性。我们的模型在KITTI数据集的汽车类别上取得了AP3D@0.7的成绩，分别为59.82%@Easy、40.80%@Mod和34.44%@Hard，分别超越了经典模型37.32%、24.34%和20.49%。该算法模型在896*896图像上的运行速度为138.88 fps，远远超过现有的经典方法。此外，它对载体的姿态没有严格要求，表现出卓越的适应性。</

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

沉浸式AI CSDN认证博客专家 CSDN认证企业博客

码龄7年

西南交通大学

185: 原创

3万+: 周排名

7865: 总排名

13万+: 访问

: 等级

4444: 积分

1262: 粉丝

1917: 获赞

23: 评论

1770: 收藏

私信

关注

热门文章

分类专栏

最新评论

torch1.7.0之后 c++ 丢弃了＜THC/THC.h＞ THCState的修改
m0_74178663: wawawa,有用有用！！！！谢谢大佬1111
残差网络构建：Deep Layer Aggregation【方法解读】
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
『配置文件』yolo配置文件的参数说明
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
『模型评估』深度学习模型评估指标（P、R、AP、mAP等）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。