pose 整理（补充中）

momo_vv

已于 2024-03-15 18:11:57 修改

阅读量1.6k

点赞数 37

文章标签：学习

于 2024-03-15 17:54:25 首次发布

本文链接：https://blog.csdn.net/weixin_44695308/article/details/136647826

版权

文章目录

一、前言：相关知识
二、6-Dof Pose Esitimation
- 相关论文整理
- - 实例级
  - 类别级
三、Pose Tracking
四、待读文章

一、前言：相关知识

1.PnP算法：
PnP(Perspective-n-Point)是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n 个 3D 空间点以及它们的投影位置时,如何估计相机所在的位姿。——《视觉SLAM十四讲》

通俗的讲，PnP问题就是在已知世界坐标系下N个空间点的真实坐标以及这些空间点在图像上的投影，如何计算相机所在的位姿。换句话说，就是已知量为空间中的真实坐标和图像坐标，求解相机的位姿（未知量）

2.BOP挑战赛
BOP: Benchmark for 6D Object Pose Estimation提出了一种基于单RGB-D输入图像的刚体6D姿态估计基准。训练数据由一个纹理映射的三维物体模型或已知6D姿势的物体图像组成。该基准包括：i）8个统一格式的数据集，涵盖不同的实际情况，包括两个新的数据集，侧重于不同的照明条件；ii）一个具有姿势误差函数的评估方法，处理姿势模糊性，iii）对15种不同的近期方法进行综合评估，以了解该领域的现状；iv）一个在线评估系统，可随时提交新的结果。

3.实例级&类别级&novel：
实例级：训练和测试为统一实例CAD的不同图像
类别级：针对同一类的不同物体，可以没有CAD
novel：即使测试给CAD，也是与训练时完全不同的物体

二、6-Dof Pose Esitimation

针对单帧

发展历程：逐步泛化
- 实例级（需要CAD，且训练时见过）–>类别级
当前发展方向：
- 遮挡、复杂场景问题
- 引入潜在空间描述（MatchU、FoundationPose）
- novel物体（SAM-6D）
- 数据获得问题—小样本/数据生成手段（OnePose、FoundationPose、SAM-6D）
- 联合建模（Esitimation与tracking –FoundationPose、Esitimation与segmentation–SAM-6D、tracking与重建–BundleSDF）
思路
- 直接回归pose----旋转空间非线性，很难，可以做离散化
- 利用关键点，再PnP：搜索空间比直接回归要小
  - 回归关键点坐标
  - 投票----有效处理遮挡

三、Pose Tracking

针对连续视频（更符合实际）

6PACK（2019）：基于关键点，基本思想是通过距离加权投票出一个目标锚点(距离物体质心最近的锚点)，再由目标锚点无监督生成1组有顺序的关键点（无需手动标注），通过连续帧之间关键点的坐标变化估计帧间的相对位姿Δp。对于旋转对称的物体，提出了一种旋转不变的空间坐标表示。（对初始化敏感）
CAPTRA（ICCV 2021）：估计的是连续的9Dof Pose，包括6Dof Pose和3Dof Bounding Box，通过给定当前帧的3D点云和上一帧估计的9Dof Pose，CAPTRA输出当前帧9Dof Pose的估计。整个Pipeline由3部分组成：Pose Canonicalization Module，RotationNet和CoordinateNet。Pose Canonicalization Module与前面的NOCS和ANCSH的规范化思想一致，用于规范Pose的表示方法。RotationNet用于直接估计相邻帧之间物体旋转的变量。CoordinateNet用于预测标准化坐标和分割的模块，实现3D尺寸和平移的解析计算。
BundleTrack（IROS 2021）：提出了位姿图&内存池，全新的6D物体姿态算法，不需要实例或类级别的CAD模型用于训练或测试，可立即用于新物体的6D姿态跟踪（关键是内存池中构建位姿图，多帧之间优化）
BundleSDF（CVPR 2023）：提出一种近乎实时的因果 6-DoF 姿态跟踪和对象 3D 重建并行的新型方法，有效解决跟踪漂移问题，并可以用于严重遮挡和无纹理的情况（位姿图+SDF+内存池）。与BundleTrack相比，主要是利用神经对象场实现了3D重建，并在重建过程中进一步优化位姿。
DeepAC（ICCV 2023）：设计了一种轻量级网络，基于对物体轮廓的预测，实现实时的6Dof物体跟踪（可部署在移动端）

四、待读文章

OnePose（CVPR 2022）：解决样本问题，one-shot预测
se(3)-TrackNet（2020 wenbowen）：

momo_vv

关注

37
点赞
踩
28

收藏

觉得还不错? 一键收藏
1
评论
pose 整理（补充中）

1.PnP算法：PnP(Perspective-n-Point)是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n 个 3D 空间点以及它们的投影位置时,如何估计相机所在的位姿。——《视觉SLAM十四讲》通俗的讲，PnP问题就是在已知世界坐标系下N个空间点的真实坐标以及这些空间点在图像上的投影，如何计算相机所在的位姿。换句话说，就是已知量为空间中的真实坐标和图像坐标，求解相机的位姿（未知量）2.BOP挑战赛。
复制链接

扫一扫