TANDEM 基于深度多视图立体视觉的实时跟踪和稠密建图

最新推荐文章于 2024-05-09 09:56:46 发布

点云PCL公众号博客

最新推荐文章于 2024-05-09 09:56:46 发布

阅读量4.8k

点赞数 3

文章标签：机器学习人工智能计算机视觉深度学习大数据

本文链接：https://blog.csdn.net/u013019296/article/details/122375276

版权

点云PCL免费知识星球，点云论文速读。

文章：TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view Stereo

作者：Lukas Koestler Nan Yang y Niclas Zeller Daniel Cremers

编译：点云PCL

代码：https://github.com/tum-vision/tandem.git

欢迎各位加入免费知识星球，获取PDF论文，欢迎转发朋友圈。文章仅做学术分享，如有侵权联系删文。未经博主同意请勿擅自转载。

论文阅读模块将分享点云处理，SLAM，三维视觉，高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享，欢迎各位加入我，我们一起每天一篇文章阅读，开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。

摘要

本文提出了一个实时单目跟踪和稠密建图框架，对于姿态估计，TANDEM基于关键帧的滑动窗口进行BA(bundle adjustment)，为了增强鲁棒性，提出了一种新的跟踪前端，该前端使用由稠密深度预测增量构建的全局模型渲染的深度图，来执行稠密直接图像对齐，为了预测稠密的深度图，提出了级联视图聚合MVSNet (CVA-MVSNet)，它利用整个活动关键帧窗口，通过分层构造具有自适应视图聚合的3D成本量来平衡关键帧之间的不同立体基线，最后，将预测的深度图融合为一致的全局图，以截断的带符号距离函数(TSDF)体素网格表示，最终的实验结果表明，TANDEM在相机跟踪方面优于其他先进的传统和基于学习的单目视觉里程计(VO)方法，此外，TANDEM还展示了最先进的实时三维重建性能。

主页：https://go.vision.in.tum.de/tandem

图1:TANDEM是一种单目密集SLAM方法，用于估计相机姿势并实时重建3D环境

主要贡献

（1）提出一种新颖的实时单目密集SLAM框架，无缝结合了经典的直接法VO和基于学习的MVS三维重构；

（2）据我们所知，第一个利用全局TSDF模型渲染的深度的单目稠密跟踪前端；

（3）一种新颖的MVS网络，CVA-MVSnet，它能够通过利用视图聚合和多级深度预测来利用整个关键帧窗口；

（4）在合成和真实的数据上，达到了最先进的跟踪和重建结果。

主要内容

方案主要有三部分组成：单目视觉里程计、CVA MVSNet稠密深度估计和体积建图。图2a显示了系统的概述，视觉里程计利用单目视频流和3D TSDF模型渲染的密集深度，以滑动窗口方式估计摄像机姿势。给定关键帧及其估计姿势，提出的CVA MVSNet预测参考关键帧的稠密深度贴图，为了重建环境的完整且全局一致的3D模型，深度贴图随后通过体素散列融合到TSDF体素网格中，通过无缝集成这些组件，最终的system TANDEM能够从单目相机实现实时跟踪和高质量稠密贴图。

图2：（a）使用视觉里程计优化的稀疏点和3D模型渲染的稠密深度图跟踪每帧，关键帧的姿态通过滑动窗口光度束调整进行估计，并输入CVA MVSNet进行稠密的深度预测，深度贴图融合为全局一致的TSDF体积，（b） CVA MVSNet构建级联成本量并分层估计深度图，视图聚合模块通过预测自适应权重，有效地聚合多视图图像的特征

实验

图3 DeepFactors、Atlas和未知序列上的TANDEM深度比较，TANDEM产生更精细的比例细节，例如第二排的设备或第三排的梯子，对于EuRoC，只有稀疏的地面真实深度可用。

图4:Atlas和TANDEM在未知序列上的定性比较，Atlas不构建纹理网格，这里还从TANDEM渲染纯几何体以进行比较

表1:EuRoC的位姿评估，所有的方法都是模拟对齐的w.r.t.真值轨迹，显示了五次运行期间的平均绝对姿态误差和标准偏差

表2:在VO窗口中使用所有关键帧不会改善基线，然而，将Win与视图聚合（VA）相结合会以增加推理运行时间和内存为代价产生更准确的结果

三维重建的实验对比

总结

我们介绍了TANDEM，一种实时稠密的单目SLAM系统，该系统采用了一种新颖的设计，将直接光度视觉里程计与深度多视角立体视觉相结合，特别是提出了CVA MVSNet，它有效地利用了整个关键帧窗口并预测高质量的深度贴图，此外，提出的密集跟踪方案通过跟踪TSDF融合生成的全局3D模型，将摄像机姿态估计和密集3D重建联系起来，定量和定性实验表明，在合成数据和真实数据的三维重建和视觉里程测量方面，TANDEM方法比其他最先进的方法取得了更好的结果。我们认为，TANDEM三维重建的效果进一步缩小了RGB-D重建之间的差距。

资源

三维点云论文及相关应用分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

3D目标检测：MV3D-Net

三维点云分割综述（上）

3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割（2020）

win下使用QT添加VTK插件实现点云可视化GUI

JSNet：3D点云的联合实例和语义分割

大场景三维点云的语义分割综述

PCL中outofcore模块---基于核外八叉树的大规模点云的显示

基于局部凹凸性进行目标分割

基于三维卷积神经网络的点云标记