Learning hand-eye coordinationfor robotic grasping with deep learning and large-scale data collecti

cocapop

已于 2024-01-02 17:01:17 修改

阅读量615

点赞数 8

分类专栏：论文文章标签：机器人

于 2023-12-29 18:40:43 首次发布

本文链接：https://blog.csdn.net/cocapop/article/details/135296774

版权

论文专栏收录该内容

42 篇文章

订阅专栏

本文提出一种基于深度学习的抓取方法，通过训练卷积神经网络预测抓取成功率，实现机器人仅凭单目图像进行手眼协调抓取。大规模数据采集和连续伺服控制使得机器人能适应新目标并自我纠正。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目：基于深度学习的机器人抓取手眼协调学习和大规模数据采集

摘要：我们描述了一种基于学习的手眼协调方法，用于机器人从单目图像抓取。为了学习手眼协调抓取，我们训练了一个大型卷积神经网络来预测抓取器的任务空间运动成功抓取的概率，只使用单目摄像机图像，独立于摄像机标定或当前机器人姿态。这就需要网络去观察抓爪与场景中物体之间的空间关系，从而学习手眼协调然后利用该网络对夹持器进行实时伺服控制，实现成功的抓取。为了训练我们的网络，我们在两个月的时间里收集了超过 80 万次的抓取尝试，在任何给定的时间使用 6 到 14 个机器人操纵器，摄像机的位置和硬件都有所不同。实验结果表明，该方法能够实现有效的实时控制能够成功地抓取新目标，并通过连续伺服纠正错误

一、简介

本文中，我们提出了一种基于学习的手眼协调方法，我们在一个机器人抓取任务上进行了演示。我们的方法是数据驱动和以目标为中心的:我们的方法学习伺服一个机器人抓手通过端到端训练，直接从图像像素到任务空间的夹持器运动，很可能产生成功的抓取姿势。通过不断地重新计算最有希望的运动指令，我们的方法不断地整合来自环境的感官线索，使其能够对扰动做出反应，并调整抓取，以最大限度地提高成功的概率。此外，电机指令是在机器人框架内发出的，这是模型在测试时所不知道的。这意味着该模型不需要根据末端执行器对相机进行精确校准，而是使用视觉线索来确定场景中夹持器和可抓取物体之间的空间关系。

二、相关工作

抓取可分为几何驱动和数据驱动的方法。

几何方法分析目标物体的形状，并根据诸如力闭合或笼型等标准计划一个合适的抓握姿势。该方法需要了解场景的几何形状，使用深度或立体传感器，并将之前扫描的模型与观测结果进行匹配。

数据驱动的方法有多种不同的形式，包括基于监督的预测抓取配置Herzog2014，Lenz2015；通过离线计算的几何标准预测手指位置的方法Goldfeder2009。这两种类型的数据驱动抓取选择在最近研究中都加入和深度学习Kappler2015，Lenz2015，Red-mon&Angelova2015.