OpenAI掀翻机器人圈，首个OpenAI大模型加持机器人Demo，ChatGPT也有身体了

AIGC Studio

于 2024-03-15 19:57:36 发布

阅读量627

点赞数 17

分类专栏： AIGC 深度学习文章标签：人工智能 AIGC OpenAI Figure chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xs1997/article/details/136748600

版权

深度学习同时被 2 个专栏收录

328 篇文章

订阅专栏

318 篇文章

订阅专栏

OpenAI大模型加持的机器人，深夜来袭！名曰Figure 01，它能听会说，动作灵活。能和人类描述眼前看到的一切：

“我在桌子上看到了一个红色的苹果，沥水架上面还有几个盘子和一个杯子；然后你站在附近，手放在桌子上。”

听到人类说“想吃东西”，就马上递去苹果。

而且对于自己做的事有清楚认知，给苹果是因为这是桌上唯一能吃的东西。还顺便把东西整理，能同时搞定两种任务。

最关键的是，这些展示都没有加速，机器人本来的动作就这么迅速。好家伙，网友都去紧急艾特波士顿动力、特斯拉了。

Figure发布了一个巨牛的演示，LLM的多模态对话能力加上机器人对物质世界的干涉能力，我们设想的那种机器人可能真的快了。

项目的一些背景信息

OpenAI + Figure

在基于端到端神经网络的框架下与人类进行对话：

OpenAI负责提供视觉解析和语言理解能力
Figure的神经网络则负责实现快速、基础、灵活的机器人动作

(下面是相关讨论) 这里提供一些背景信息：

两周前，我们宣布Figure + OpenAI联手，致力于推动机器人学习的新阶段。我们共同开发着下一代人形机器人的AI模型

自那以后已过去13天，今天我们很激动地分享这些最新进展视频里展示的是端到端神经网络的运作，并没有进行远程操控。同时，视频是以正常速度（1.0倍速）连续拍摄的。

如视频所示，机器人的运动速度已经大幅提升，逐渐接近人类速度 Figure的机载摄像头将图像输入到OpenAI训练的大型视觉-语言模型（VLM）。

Figure的神经网络还能通过机器人上的摄像头以每秒10帧的速度处理图像。随后神经网络以每秒200次的频率输出具有24个自由度的动作。

除了开发领先的AI技术，Figure还实现了全面的垂直整合。我们拥有专业的工程师团队，负责设计：

电机
固件
散热系统
电子组件
中间件操作系统
电池系统
执行器传感器
机械与结构设计

官方视频展示

Figure官方Twitter视频介绍

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIGC Studio 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。