【论文笔记】Track to Reconstruct and Reconstruct to Track

最新推荐文章于 2024-08-06 10:46:16 发布

hong7425

最新推荐文章于 2024-08-06 10:46:16 发布

阅读量514

点赞数

文章标签：计算机视觉人工智能 3d 目标跟踪

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40498388/article/details/125651759

版权

本文介绍了一种多目标跟踪算法MOTSFusion，它利用3D重建技术和动态融合来改善遮挡目标的跟踪并恢复漏检。该算法通过3D场景重构、动态3D目标融合和轨迹合并等步骤，有效解决目标跟踪中的长期遮挡问题。实验结果在KITTI数据集上验证了其优越性，且对不同深度输入具有鲁棒性。

摘要由CSDN通过智能技术生成

文献来源

J. Luiten, T. Fischer and B. Leibe, “Track to Reconstruct and Reconstruct to Track,” in IEEE Robotics and Automation Letters, vol. 5, no. 2, pp. 1803-1810, April 2020, doi: 10.1109/LRA.2020.2969183.

一、什么是MOTSFusion？

利用目标轨迹进行三维重建，再利用重建来改进跟踪效果的多目标跟踪算法。

本文贡献：

1.提出了一个能进行长期跟踪的算法，利用动态3D物体重建来完成对长期遮挡的目标的跟踪。
2.提出的算法能从3D重建中获得目标的3D运动信息，从中恢复漏检的目标。
3.通过实验验证了算法的有效性

二、为什么提出MOTSFusion？

多目标跟踪算法，既要能在目标连续存在的帧中跟踪目标，也要在物体因遮挡而不可见的长时期内跟踪目标。但目前很多算法大多专注于前者，当目标长时间地消失或者被遮挡的时候，这些算法的跟踪效果就大打折扣了。所以本文提出了利用三维重建来帮助跟踪目标，以应对遮挡和恢复丢失的目标，改善长期跟踪结果。

三、怎么实现MOTSFusion？

算法流程图：

算法流程图

算法结构：

1）输入

本算法使用视频、每帧摄像机的自主运动(ego-motion)和深度估计作为输入。在本算法的实验中，深度估计使用的是DispNet3估计的空间深度信息，自主运动估计来自一个SLAM算法，目标检测算法使用RRC和Track R-CNN网络，光流算法使用此算法。这些算法也可以换别的算法，灵活性比较大。

2）bounding box到分割掩码

估计每个检测出来的bounding box的分割掩码。利用BB2SegNet,使用一个卷积神经网络来裁剪调整bounding

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】Track to Reconstruct and Reconstruct to Track

利用目标轨迹进行三维重建，再利用重建来改进跟踪效果的多目标跟踪算法。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。