Multi-view Self-supervised Deep Learning for 6D Pose Estimation in the Amazon Picking Challenge—2017(笔记)
亚马逊采摘挑战赛(APC)中用于6D姿态估计的多视图自我监督深度学习
文章所提出的姿态估计方法,实际上属于简化的基于模板匹配的方法。利用CNN对多视图RGB-D图像点云进行分割,并将其与预扫描目标完成配准,最终得到估计姿态。同时为解决训练数据集生成和标记问题,文章引入了一种自监督的方法来生成大型标签数据集。
摘要
- 本文提出了一种利用多视图RGB-D数据和自我监督,数据驱动的学习实现在杂乱环境,自闭塞,传感器噪声和各种各样的物体中可靠地识别和定位的方法。
- 在提出的方法中,我们使用完全卷积的神经网络对场景的多个视图进行分割和标记,然后将预扫描的3D对象模型拟合到最终的分割中,以获得6D对象姿态。
- 我们提出了一种自监督的方法来生成大型标签数据集,而无需进行繁琐的手动分割。我们证明了系统可以在各种情况下可靠地估计对象的6D姿态。所有代码,数据和基准均可在http://apc.cs.princeton.edu/获得。