OK-Robot机器人实现零样本算法可在非结构化环境下完成拾取与放置任务

最新推荐文章于 2024-07-08 18:29:19 发布

xwz小王子

最新推荐文章于 2024-07-08 18:29:19 发布

阅读量853

点赞数 7

分类专栏：机器人强化学习及自动驾驶文章标签：机器人人工智能

本文链接：https://blog.csdn.net/weixin_44887311/article/details/136111366

版权

机器人同时被 2 个专栏收录

46 篇文章 0 订阅

订阅专栏

强化学习及自动驾驶

20 篇文章 0 订阅

订阅专栏

纽约大学与Meta合作的机器人团队开发出OK-Robot，借助视觉语言模型在陌生环境中成功执行物品抓取与放置任务，尽管成功率受环境因素影响，但零样本算法表明该技术具有潜力。

摘要由CSDN通过智能技术生成

纽约大学的机器人专家团队与Meta人工智能学院研发人员共同合作开发了一种新型机器人，该机器人具备在非结构化环境下的认知能力，可在陌生房间利用视觉语言模型（VLMs），进行物品的抓取与放置。在论文当中，该团队详细阐述了机器人的编程过程以及其在多个实际环境中的测试表现。

研究人员指出，视觉语言模型（VLMs）在过去几年中取得了很快的进步，在根据语言提示识别物体方面已经非常出色。此外团队成员也提到目前机器人夹具控制技术也在进步，机器人可以轻松的将物体拾起，即便是易碎或柔软材料，也不会将其弄坏。但基于VLMs与机器人结合的相关应用依旧处于待探索阶段。

在这里插入图片描述

该项研究当中，科学家们尝试运用Hello Robot公司所售的一款机器人来完成这一测试。该机器人具备轮子、杆子以及可伸缩手臂，手部设有夹具。研究团队为其配备了先前经过训练的视觉语言模型（VLMs），并将其命名为OK-Robot。
在这里插入图片描述

在这里插入图片描述

在实际落地测试方面，研究团队将OK-Robot分别带入10 个志愿者家中，用iPhone对室内场景进行扫描，使用LangSam和CLIP进行计算，并存储在语义内存中。之后给定一个必须选择的对象的语言查询，查询的语言表示与语义记忆相匹配。随后，导航和拾取基元将按顺序分步执行，移动到所需夹取的物品前进行拾取，之后在需要放置的位置，将物品放置。实际测试过程当中，OK-Robot顺利将架子上粉色的瓶子放置在垃圾桶当中。
在这里插入图片描述

OK-Robot共执行了多达170项抓取与放置测试，任务成功率为58%。然而这种成功率很大一部分受环境因素影响，比如物品太大，物品呈现半透明状态，以及物品太滑难以夹取等方面，研究团队重新整理空间之后，成功率提升至82%。

在这里插入图片描述

研究团队指出，OK-Robot所搭载的系统是零样本算法，这意味着OK-Robot没有在工作环境中接受过训练，因此所取得这样的成绩，证明搭载VLMs功能的机器人是可行的。

xwz小王子

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
OK-Robot机器人实现零样本算法可在非结构化环境下完成拾取与放置任务

随后，导航和拾取基元将按顺序分步执行，移动到所需夹取的物品前进行拾取，之后在需要放置的位置，将物品放置。纽约大学的机器人专家团队与Meta人工智能学院研发人员共同合作开发了一种新型机器人，该机器人具备在非结构化环境下的认知能力，可在陌生房间利用视觉语言模型（VLMs），进行物品的抓取与放置。研究团队指出，OK-Robot所搭载的系统是零样本算法，这意味着OK-Robot没有在工作环境中接受过训练，因此所取得这样的成绩，证明搭载VLMs功能的机器人是可行的。
复制链接

扫一扫