本文同步于微信公众号:3D视觉前沿,欢迎大家关注。
这篇文章发表于2018年的ICRA会议,作者分别为Princeton和MIT团队的相关学者,论文有对应的项目网址。
1. 总评
当前主流进行抓取,首先需要recognize目标物体,之后估计6Dpose,再进行抓取。而这篇文章提出了一个“grasp-first-then-recognize”的框架,不先进行识别,而是直接从一堆物体中先抓取某个物体,之后再判断他的类别。这样有两点好处:主动地从一堆物体中将物体物理分隔,之后的物体识别可以看成一个图像分类问题,降低了问题的难度;可以扩展到未知物体,需要的可能只是几张物体的图像。
2. 方法综述
这篇论文提出了一个机器人pick-and-place的系统,如图1所示,能够抓取和识别杂乱场景中已知(Known)和未知(Novel)的物体。系统的关键在于能够不需要任何针对未知物体的任务导向的训练集,也能够处理一大范围类别的物体。在训练阶段提供已知物体,包含物理的物体以及代表性的商品图像(来自网络),未知的物体只在测试阶段提供,包括代表性的商品图像;