OpenAI大模型的人形机器人，会听，会说，会决策

英智未来

已于 2024-03-29 15:29:18 修改

阅读量416

点赞数 5

文章标签：机器人人工智能 gpu算力语言模型

于 2024-03-15 16:24:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ai2nv/article/details/136743277

版权

OpenAI大模型加持的机器人，Figure 01，凭借OpenAI的生成式AI技术，实现和人实时对话、理解和听从指令等能力，让人不得不感叹：未来10年绝对是一个颠覆的时代。

Figure 官方账号在 X 上表示：“运用 OpenAI 的技术，Figure 01 现在能够进行完整的对话交流。” 他们为机器人赋予了高级视觉和语言智能，让机器人具有理解并立即反应人类互动的能力。

以下是Figure 01 与它的开发者、高级 AI 工程师 Corey Lynch 互动视频，无加速处理，没有任何剪辑，也没有远程控制。

能识别眼前看到的一切

能听从指令，给人递苹果

能判定桌子上的食物和垃圾，并分类整理

OpenAI视觉语言大模型VLM的引入

Corey Lynch在X分享道: “Figure 01机器人能够准确理解周围环境，规划动作，短期记忆能力，并语言解释它的推理过程。”他们将机器人相机捕获的图像和机载麦克风捕获的语音转化为文字，输入到OpenAI预训练的VLM中处理，通过文本转语音的形式传递给人类。

同样的模型，也负责决定在机器人上运行哪些学习的闭环行为来完成给定的命令，将特定的神经网络权重加载到 GPU 上并执行策略。神经网络的训练和推理需要大量的计算资源，尤其是处理复杂的模型和实时数据。

比如，在Figure 的机载摄像头以 10hz 的频率拍摄图像，神经网络以 200hz 输出 24 个自由度动作，这无疑需要大量GPU来支撑神经网络对图像的处理、特征提取和推理过程。

先进GPU算力的支持

由于实时处理多个输入数据并输出结果，对于GPU的并行计算能力要求非常高，高端的GPU能够支撑这种短时间内需要处理大量数据并实时输出结果的应用场景。NVIDIA GPU搭载深度学习和AI任务硬件加速器Tensor Cores和 CUDA Core，能够快速执行矩阵乘法等操作，提供强大的并行处理能力。使得机器人能够在实时环境中快速处理海量数据，并迅速做出决策和行动，大幅度提高机器人的反应速度和执行效率。

同时，NVIDIA GPU强大的通用计算能力，能够支持各种复杂的深度学习算法和神经网络模型，使机器人能够进行复杂的模式识别、自主学习和决策制定。NVIDIA GPU支持将强大的人工智能计算与图像和媒体加速结合在一起，为机器人提供全面的智能计算能力，目前仍然是机器人的首选人工智能芯片。

英智未来BayStone平台，聚焦全球各地区算力运营商的算力资源，可提供搭载RTX系列、HGX1系列等不同规格主流显卡的高性能GPU服务器，按需调度为企业解决高端算力紧缺的问题。

文章来源公众号：英智未来

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
OpenAI大模型的人形机器人，会听，会说，会决策

OpenAI大模型加持的机器人，Figure 01，凭借OpenAI的生成式AI技术，实现和人实时对话、理解和听从指令等能力，让人不得不感叹：未来10年绝对是一个颠覆的时代。Figure 官方账号在 X 上表示：“运用 OpenAI 的技术，Figure 01 现在能够进行完整的对话交流。” 他们为机器人赋予了高级视觉和语言智能，让机器人具有理解并立即反应人类互动的能力。
复制链接

扫一扫

英智未来 CSDN认证博客专家 CSDN认证企业博客

码龄1年

116: 原创

1万+: 周排名

1万+: 总排名

6万+: 访问

: 等级

2088: 积分

684: 粉丝

838: 获赞

8: 评论

820: 收藏

私信

关注

热门文章

最新评论

为什么RTX 4090更受欢迎
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
生成式AI入门指南
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“生成式AI入门指南”让我非常期待阅读。您的持续创作令人钦佩，能为读者提供深入了解生成式AI的指南无疑是一项宝贵的贡献。在下一步的创作中，或许您可以考虑探讨生成式AI在不同领域的应用，或者分享一些实用的案例和技巧，以帮助读者更好地运用这项技术。再次感谢您的努力，期待您未来更多的精彩文章！
生成式AI技术有哪些应用场景
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题“生成式AI技术有哪些应用场景”非常吸引人。通过您的文章，我对生成式AI技术的应用场景有了更深入的了解。您的解释清晰易懂，让我受益匪浅。在下一步的创作中，我建议您可以进一步拓展每个应用场景的实际案例，这样读者们能更好地理解这些技术在现实中的运用。同时，如果能够加入一些相关的研究领域或者当前的热点问题，将会使读者更加着迷。期待你继续创作更多优质的博客，谦和的语气与深入的探讨将使您的文章更加引人入胜！加油！
2024 年 AI 技术应用趋势的预测
CSDN-Ada助手: 恭喜您在博客领域持续创作，分享了关于 2024 年 AI 技术应用趋势的预测。这篇博客对未来的发展趋势进行了深入的探讨，让读者对 AI 技术的发展方向有了更清晰的认识。希望您能够继续保持创作热情，为我们带来更多有见地的观点和预测。也许下一步可以尝试结合实际案例，或者从不同的角度来分析 AI 技术的发展，让读者获益更多。期待您的下一篇精彩博客！
大模型部署过程中需要注意的事项
CSDN-Ada助手: 恭喜您写了第13篇博客！标题“大模型部署过程中需要注意的事项”非常吸引人。您在这个领域的知识和经验一定非常丰富。我期待着您未来更多的博客，并希望您能继续分享关于大模型部署的实用建议。或许您可以探索一下大模型优化的技巧，或者分享一些常见的部署错误及其解决方法。无论您选择哪个方向，我相信读者们都会非常受益！谢谢您的分享！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

英智未来 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。