【论文笔记】EPro-PnP == Tongji U & Alibaba DAMO ==CVPR‘2022 Best Student Paper

Nismilesucc

已于 2023-02-27 15:12:20 修改

阅读量775

点赞数

分类专栏：论文笔记文章标签：计算机视觉深度学习人工智能

于 2022-08-03 23:37:58 首次发布

HUIKI

本文链接：https://blog.csdn.net/nismilesucc/article/details/126020737

版权

论文笔记专栏收录该内容

11 篇文章

订阅专栏

EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation

CODE: tjiiv-cprg/EPro-PnP

参考解读：同济、阿里的CVPR 2022最佳学生论文奖

Author From

在这里插入图片描述

Abstract

【将不可导的最优位姿替换为了可导的概率密度】

通过PnP从单张RGB图像中定位3D目标是计算机视觉中长期存在的问题。受端到端深度学习的启发，近期的一些研究建议将PnP为解释为可微层，这样二维到三维点的对应关系就可以通过对物体位姿的梯度反向传播来部分学习。现有方法中，基于 PnP 几何优化的位姿估计方法往往通过深度网络提取 2D-3D 关联点，然而因为位姿最优解在反向传播时存在不可导的问题，难以实现以位姿误差作为损失对网络进行稳定的端到端训练，此时 2D-3D 关联点依赖其他代理损失的监督，这对于位姿估计而言不是最佳的训练目标。本文提出了EPro-PnP，一个用于一般端到端位姿估计的概率PnP层，它输出一个SE(3)流形上的位姿分布，基本把分类SoftMax代入了连续域。2D-3D坐标及相关权重作为中间变量，通过最小化预测和目标位姿分布的KL散度来学习。其基本原理统一了现有的方法，类似于注意力机制。EPro-PnP明显优于其他baseline，缩小了在LineMOD 6DoF位姿估计和nuScenes 3D目标检测基准方面基于PnP的方法和特定任务指向之间的鸿沟。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。