RT-H：谷歌的端到端视觉-语言-动作机器人大模型

最新推荐文章于 2025-04-26 16:03:56 发布

zllz0907

最新推荐文章于 2025-04-26 16:03:56 发布

阅读量1.5k

点赞数 7

分类专栏：具身智能文章标签：机器人 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaoliang38/article/details/136934595

版权

论文标题：RT-H: Action Hierarchies Using Language

论文链接：https://arxiv.org/pdf/2403.01823.pdf

项目链接：RT-H: Action Hierarchies Using Language

Robot Transformer with Action Hierarchies使用行动层级的机器人Transformer

端到端框架RT-H：单一模型同时处理语言动作和行动查询

一、RT-H action hierarchy

1. 将复杂任务分解成简单的语言指令

2. 将语言指令转化为机器人行动

3. 支持对模型进行语言动作干预的微调

4. 开发了一种自动化方法，从机器人本体感受中提取简化的语言动作集，建立了超过2500个语言动作数据库，无需手动标注

举例：

给定任务

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。