BundleTrack：无3D模型的6D对象姿态跟踪-CSDN博客

本文链接：https://blog.csdn.net/Tang_Zhe/article/details/122670462

BundleTrack: 6D Pose Tracking for Novel Objects without Instance or Category-Level 3D Models

特别之处：

常见的6D姿态跟踪，对输入数据的要求（至少满足一个）：

结构：

输入：

步骤：

一、具体结构

计算目标物体的掩码

Transductive-VOS Network

[input] 当前帧的RGBD图像和上一帧的掩码: $image_{t}$ & $mask_{t-1}$

[output] 当前帧的掩码: $mask_{t}$

检测物体的关键点、并提取关键点的特征

LF-Net

[input] 当前帧的目标区域（根据掩码得到）： $region_{t}$

[output] 当前帧关键点的位置和特征（500个关键点，每个关键点包含一对x,y坐标，和一个1*128特征向量）： $keypoint_{t}$ & $feature_{t}$

特征匹配、边缘修剪（RANSAC）

[input] 上一帧和当前帧的关键点及特征： $keypoint_{t-1}$ & $feature_{t-1}$ & $keypoint_{t}$ & $feature_{t}$

[output] 特征的对应关系：feature correspondences

初步估计位姿

[input] 特征的对应关系：feature correspondences

[output] 初步计算的位姿： $\widetilde{T}_{t}$

选择关键帧

[input] 当前帧的图像和（所有）以前的帧： $image_{t}$ & memory pool

[output] 被选出的关键帧（与当前帧重合率最高的k帧）： k key frames

位姿图优化：根据关键帧和当前帧的关键点，通过最小化特征残差和几何残差优化位姿（t时刻和过去k个时刻的位姿都会被更新）

[input] 初步计算的位姿变换矩阵，关键帧： $\widetilde{T}_{t}$ & key frames

[output] 优化后的位姿： $T_{t}$

* 消除累计误差的关键

方法	类别 tracking-by-	速度	是否有累计误差	（有/无）累计误差的原因		备注
方法	类别 tracking-by-	速度	是否有累计误差	估计当前位姿时考虑的历史帧数	其他	备注
MaskFusion	detection (reconstruction)	17Hz	1	1	跟踪的同时构建物体模型——检测的误差会导致模型误差	任何一帧的检测误差和位姿估计误差都会影响后续帧
6-PACK	keypoints	4Hz	1	1
BundleTrack	keypoints	10Hz	0	前一帧+多个相关性最强的（max15）	位姿优化时，同时优化当前帧和历史帧的位姿	先基于前一帧粗略计算出位姿，再根据多个历史帧优化位姿。计算量增大，需使用CUDA加速