- 博客(1)
- 收藏
- 关注
翻译 Video based Object 6D Pose Estimation using Transformers阅读
我们介绍了一个基于Transformer的6D对象姿态估计框架VideoPose,包括一个端到端基于注意力的建模体系结构。以估计视频中准确的6D物体姿势。我们的方法利用视频序列的时间信息进行姿态细化,计算效率高,鲁棒性好。与现有的方法相比,我们的体系结构能够有效地捕获和推理远程依赖关系,从而迭代地优化视频序列。对YCB-Video数据集的实验评估表明,我们的方法与最先进的Transformer方法相当,并且性能明显优于基于CNN的方法。此外,在33帧/秒的速度下,它也更有效,因此适用于各种需要实时物体姿态估
2022-10-30 22:31:38 460
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人