编译新型Omnipush数据集的关键是构建模块化对象

原文链接： https://news.mit.edu/2019/pushy-robots-learn-fundamentals-object-manipulation-1022

原文作者： Rob Matheson

翻译人： HeQiang

进取的机器人学习对象操纵的基础

摘要：系统从新颖的数据集中“学习”，该数据集捕获被推动对象的运动方式，以改善其与新对象的物理交互。

麻省理工学院的研究人员已经汇编了一个数据集，该数据集捕获了物理上推动数百个不同对象的机器人系统的详细行为。研究人员可以使用数据集（同类中规模最大，种类最多的数据）训练机器人，以“学习”推动动力学，这对于许多复杂的对象操纵任务（包括重新定向和检查对象以及整齐的场景）都是至关重要的。

为了捕获数据，研究人员设计了一个自动化系统，该系统包括具有精确控制的工业机械手，3D运动跟踪系统，深度和传统相机以及将所有东西缝合在一起的软件。手臂推着模块化的物体，可以调整它们的重量，形状和质量分布。对于每次推动，系统都会捕获这些特征如何影响机器人的推动。

名为“ Omnipush”的数据集包含250个对象的250个不同的推送，总计大约62,500次唯一推送。例如，研究人员已经在使用它来构建模型，以帮助机器人预测物体在被推动时会降落在何处。

机械工程学系（MechE）的研究生，第一篇描述Omnipush的论文的作者Maria Bauza说：“我们需要大量丰富的数据来确保我们的机器人能够学习。”智能机器人和系统。“在这里，我们正在从真实的机器人系统中收集数据，并且[对象]足够多以捕获丰富的推动现象。这对于帮助机器人理解推动的工作方式以及将这些信息转换为现实世界中的其他类似对象非常重要。”

与Bauza一天撰写论文的论文包括：Ferran Alet和Lin Yen-Chen Lin，计算机科学与人工智能实验室和电气工程与计算机科学系（EECS）的研究生；工程学院卓越教学教授Tomas Lozano-Perez；Leslie P. Kaelbling，松下计算机科学与工程系教授；EECS助理教授Phillip Isola；以及MechE副教授Alberto Rodriguez。

多样化的数据

为什么要专注于推动行为？Rodriguez解释说，建模涉及物体和表面之间摩擦的推动动力学，对于更高级别的机器人任务至关重要。考虑一下通过视觉和技术会玩Jenga是一种令人印象深刻的机器人，这是Rodriguez最近合作设计的。“机器人正在执行一项复杂的任务，但是驱动该任务的机制的核心仍然是推动，例如块之间的摩擦会影响的物体的运动，” Rodriguez说。

Omnipush建立在Rodriguez，Bauza和其他研究人员在操纵与机制实验室（MCube）中建立的类似数据集的基础上，该数据集仅捕获了10个对象上的推入数据。在2016年将数据集公开后，他们收集了研究人员的反馈。一种抱怨是缺乏对象多样性：在数据集上受过训练的机器人努力地将信息推广到新的对象上。也没有视频，这对于计算机视觉，视频预测和其他任务很重要。

对于他们的新数据集，研究人员利用工业机器人手臂精确控制推进器（基本上是垂直钢棒）的速度和位置。当手臂推动物体时，将在电影，虚拟现实和研究中使用的“ Vicon”运动跟踪系统跟随物体。还有一个RGB-D摄像机，可将深度信息添加到捕获的视频中。

关键是构建模块化对象。由铝制成的均匀的中央部件看起来像四角星，重约100克。每个中心部分的中心和点都包含标记，因此Vicon系统可以在1毫米内检测到其姿势。

可以将四个形状较小的零件（凹形，三角形，矩形和圆形）磁性连接到中央零件的任何一侧。每块重量在31到94克之间，但是额外的重量（从60到150克不等）可以掉入这些块的小孔中。所有类似拼图的物体在水平和垂直方向都对齐，这有助于模拟形状和质量分布相同的单个物体的摩擦。不同侧面，重量和质量分布的所有组合增加了250个唯一对象。

每次推动时，手臂会自动移动到距对象几厘米的随机位置。然后，它选择一个随机方向并将对象推一秒钟。从停止的地方开始，然后选择另一个随机方向，并重复该过程250次。每次推送都会记录对象和RGB-D视频的姿势，这些姿势可用于各种视频预测目的。每天花费12个小时来收集数据，耗时两个星期，总计超过150个小时。仅在手动重新配置对象时才需要人工干预。

这些对象并没有专门模仿任何现实生活中的物品。取而代之的是，它们旨在捕获现实世界对象预期的“运动学”和“质量不对称性”的多样性，从而模拟现实世界对象运动的物理过程。然后，机器人可以将质量分布不均匀的Omnipush对象的物理模型外推到重量分布不均相似的任何现实世界对象。

想象一下，推桌子时要用四只腿，其中最大的重量超过了一只腿。推桌子时，您会看到它在沉重的腿上旋转，必须重新调整。罗德里格斯说，了解质量分布及其对推动结果的影响是机器人可以从这组对象中学到的东西。

推动新研究

在一个实验中，研究人员使用Omnipush训练了一个模型，以预测被推物体的最终姿势，只给出推入的初始姿势和描述。他们在150个Omnipush物体上训练了模型，并在物体伸出的部分上对其进行了测试。结果表明，经Omnipush训练的模型的准确度是在一些相似数据集上训练的模型的两倍。在他们的论文中，研究人员还记录了其他研究人员可以用来比较的准确性基准。

“机器人问，‘如果我执行此操作，则对象将在此帧中的什么位置？’ 然后，它选择使物体达到所需位置的可能性最大化的动作。” Bauza说。“它通过首先想象图像在按下后将如何变化来决定如何移动对象。”

卡内基梅隆大学计算机科学和机器人学教授Matthew T. Mason说：“ Omnipush包括对象运动的精确测量以及视觉数据，用于机器人与对象之间的重要相互作用。” “机器人研究人员可以使用这些数据来开发和测试新的机器人学习方法……这将推动机器人操纵技术的不断发展。”

This is an open source AI organization from China. Welcome friends who are interested in AI to join.
OpenSourceAI
QQ : 584399282