RT-1、RT-2、RT-H：谷歌具身智能系列工作

zllz0907

已于 2024-04-15 16:05:16 修改

阅读量5.3k

点赞数 33

分类专栏：具身智能文章标签： ai 机器人

于 2024-04-12 17:28:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaoliang38/article/details/137688408

版权

RT-1

2022年 Google 机器人研究团队历时17个月基于13个机器人得到了 130k episodes 以及超过700个任务的数据，这些数据可以使机器人能够形成很好的泛化能力，从而使机器人能够发现结构相似任务之间的模式，且应用到新任务上。该数据集不仅仅规模很大，而且广度很大。在该数据集的基础之上，基于模仿学习中行为克隆学习范式，把 Transformer 应用机器人的操纵任务上，提出了 RT-1模型。

RT-1，它可以把相机图片、指令与电机命令作为输入，即可对高维的输入与输出进行编码。RT-1 的架构、数据集、以及评估概览，可见图1所示。

最终，实验表明 RT-1 可以展示较强的泛化能力和鲁棒性，可见图1.b，且可以执行长期任务。

该系统主要的贡献：RT-1 是一个高效的模型，可以吸收大量的数据，可高效的泛化，且可实时对机器人进行控制。RT-1 的输入由图片序列、自然语言指令构成，输出由机械臂运动的目标位姿( roll , pitch yaw , gripper status)、基座的运动、模式转换指令构成。机器人有三个模式，分别是：控制机械臂、基座、或者终止。

RT-2

2023年 Google 的 DeepMind 团队基于互联网上数据训练视觉-语言模型(VLM)，使其能够学习到更多关于视觉和语言之间映射关系的知识后，在机器人操纵任务上微调，提出了 RT-2 。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。