干货!单目6D物体姿态估计中基于几何指导的直接回归网络

本文介绍了一种新的单目6D物体姿态估计方法——GDR-Net,它结合几何指导的直接回归,解决了传统PnP/RANSAC算法的复杂度和不可微分问题,提高了估计的效率和准确性。GDR-Net通过ResNet和DeConv网络生成几何特征,然后用 Patch-PnP模块直接回归姿态。
摘要由CSDN通过智能技术生成

点击蓝字

3f622b6850f3e8e474f7caa1dcc1237a.png

关注我们

AI TIME欢迎每一位AI爱好者的加入!

目前单目6D物体姿态估计中效果比较好的方案是一类间接法,即先利用CNN预测出关键点建立2D-3D对应关系,然后利用PnP/RANSAC算法求解pose。这类方法存在些问题, 例如PnP/RANSAC的计算复杂度较高;不是端到端可训练的,无法得到可微分的pose;对应关系的损失函数不一定能反映真实的pose误差。本文提出一种基于几何指导的单目6D物体姿态直接回归网络,将间接法中的几何特征作为直接回归法中的指导,并且利用几何特征类似图像块的性质,利用一个简单的卷积Patch-PnP模块直接回归pose,在公开的数据集上达到当前最佳的性能。

本期AI Time PhD 直播间,我们有幸请到清华大学自动化系博士生王谷带来报告分享——《单目6D物体姿态估计中基于几何指导的直接回归网络》

6605b94a15c7c971b0a10287ccc5ce43.png

清华大学自动化系在读博士生,师从季向阳教授,主要研究方向为6D物体姿态估计。研究成果曾发表于ECCV/ICCV/CVPR/IJCV等(多次入选口头报告),曾获BOP Challenge 2019/2020单赛道冠军。

个人主页: https://wangg12.github.io/

01

 背  景 

(1)基于单张RGB图像的6D物体姿态估计

对于6D物体姿态估计,本文要解决的问题场景是使用相机拍摄到单张RGB图片,给定目标物体的三维模型,估计目标物体在场景中相对于相机的三维旋转和三维平移共6个自由度。应用场景包括机器人操纵、增强现实、自动驾驶等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值