6D姿态估计算法汇总（上）

最新推荐文章于 2024-07-29 11:43:49 发布

置顶

Tom Hardy

最新推荐文章于 2024-07-29 11:43:49 发布

阅读量9.5k

点赞数 12

分类专栏：深度学习机器学习计算机视觉

本文链接：https://blog.csdn.net/qq_29462849/article/details/103740960

版权

本文汇总了多个6D姿态估计算法，包括DenseFusion、PVNet、Normalized Object Coordinate Space等，这些方法利用RGB-D图像进行物体6D位姿估计。DenseFusion通过迭代密集融合网络消除后处理依赖，PVNet则通过像素级投票网络处理遮挡问题，而Normalized Object Coordinate Space引入了标准化物体坐标空间来处理类别级位姿和尺寸估计。所有方法在不同数据集上表现出色。

摘要由CSDN通过智能技术生成

前言

本文首发于公众号【3D视觉工坊】，原文请见6D姿态估计算法汇总（上），更多干货获取请关注公众号~

1、DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion (CVPR2019)

原文链接：https://arxiv.org/abs/1901.04780
代码链接：https://github.com/j96w/DenseFusion

主要思想：用于从RGB-D图像中估计一组已知对象的6D位姿，分别处理两个数据源，并使用一种新的dense fusion network来提取像素级的 dense feature embedding，并从中估计姿态。实验结果表明，该方法在YCB-Video和Linemod两种数据集上均优于现有的方法。论文还将所提出的方法应用到一个真实的机器人上，根据所估计的姿态来抓取和操纵物体。

本文主要有两点贡献：

1、提出了一种将RGB-D输入的颜色和深度信息融合起来的基础方法。利用嵌入空间中的2D信息来增加每个3D点的信息，并使用这个新的颜色深度空间来估计6D位姿。

2、在神经网络架构中集成了一个迭代的微调过程，消除了之前后处理ICP步骤的依赖性。

在这里插入图片描述
实验结果：