国防科大最新 | SceneTracker:在4D时空中追踪万物
我们的目标是跟踪一个3D视频中的3D点。我们形式化该问题如下:一个3D视频是一个TTT帧的RGB-D序列。估计长时场景流旨在生成已知初始位置的NNN个查询点的相机坐标系下的3D轨迹Pxyz∈RN×T×3Pxyz∈RN×T×3。默认的,所有跟踪都开始于视频的第一帧。值得注意的是,我们方法可以灵活地从任意一帧开启跟踪。我们方法的整体架构如图1所示。给定一个自动驾驶数据的序列,我们的目标是构建一个TTT帧的RGB-D视频以及第一帧中感兴趣点的3D轨迹。
原创
2024-05-15 21:38:35 ·
644 阅读 ·
0 评论