论文笔记：DeepIM

最新推荐文章于 2024-05-26 09:52:14 发布

hiberna123

最新推荐文章于 2024-05-26 09:52:14 发布

阅读量1.2k

点赞数

文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/m0_45911911/article/details/120069651

版权

文章最初通过向地面真实姿态添加噪声作为初始姿态；
文章中说，理论上，只要训练在一个单一的步骤中回归相对姿态的网络，然后将训练的网络在测试中进行多次迭代，就可以获得越来越精确的位姿；然而，作者通过实验发现，如果训练网络在一个单一的步骤中回归相对姿态，训练网络所估计的位姿在测试的多次迭代中并没有改善。因此作者在训练期间也执行多次迭代，发现结果变好了。
其实各种网络，只要更改一下输出方式，就可以应用在完全不同的任务上。如：文章中对faster-rcnn 进行简单的修改，就能做位姿估计，只是精度不高。
文章中还说可以对之前未见过的物体进行位姿迭代优化（由于提出的解耦的物体位姿变换方式）
文章中的 render（如下图中部分），可以认为就是对 3D model 进行初始pose 变换后，投影到 2D 图像的过程。投影后获得的2D 图像即为Rendered image

关注