造完“大模型”，“具身智能”将引领AI下一个浪潮？

最新推荐文章于 2024-08-05 15:57:37 发布

bagell

最新推荐文章于 2024-08-05 15:57:37 发布

阅读量916

点赞数 17

文章标签：人工智能 midjourney AI作画 stable diffusion 数据库

本文链接：https://blog.csdn.net/bagell/article/details/140357070

版权

资深机器人专家Eric Jang不久前曾预言：“ChatGPT 曾在一夜之间出现。我认为，有智慧的机器人技术也将如此。”

3月13日深夜，一段人形机器人的视频开始热传。

在视频中，Figure的人形机器人，可以完全与人类流畅对话，理解人类的意图，同时还能理解人的自然语言指令进行抓取和放置，并解释自己为什么这么做。

而其背后，就是OpenAI为其配置的大型语言模型。由于OpenAI模型还支持多模态输入，因此可为Figure提供高级视觉和语言智能。

而Figure本身，成立于2022年。从OpenAI 宣布介入与之合作，到今天它们共同推出一个能够自主对话和决策的机器人，只有13天。

具身智能的发展，显然正在加速。

具身智能

进化速度超越想象

在去年的ITF World 2023半导体大会上，英伟达创始人兼CEO黄仁勋表示，人工智能下一个浪潮将是“具身智能”（Embodied Intelligence），是能理解、推理、并与物理世界互动的智能系统，AI与机器人的融合，具有很好的想象空间。

他还介绍了英伟达的多模态具身智能系统Nvidia-VIMA，能在视觉文本提示的指导下，执行复杂任务、获取概念、理解边界、甚至模拟物理学，标志着AI能力的显著进步。

此外，在特斯拉召开2023年年度股东大会上，马斯克展示了人形机器人Optimus的全新型号，和具身智能机器人几乎划等。

马斯克表示，人形机器人将是今后特斯拉主要的长期价值来源，他也认为，以具身智能机器人为代表的产品有望成为AI的下一浪潮。

1950年，图灵在他的论文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能（Embodied AI）指的是，有身体并支持物理交互的智能体，如智能服务机器人、自动驾驶汽车等，具身智能机器人指的是，像人一样能够与环境交互感知、自助规划、决策、行动、执行任务的机器人。

它包含人工智能领域几乎所有的技术，包括机器视觉、自然语言理解、认知和推理、机器人学、博弈伦理、机器学习等，横跨多个学科方向，是AI的集大成者。

2023年是生成式AI的爆发之年，也被业内人士称为“机器人觉醒之年”。ChatGPT等生成式AI与人形机器人行业结合，开启了具身智能的时代。

今天，在大语言模型的普及和GPT-4等前沿模型的推动下，我们似乎见证了人工智能领域的一个新时代，人机交流也变得前所未有的流畅和无缝。

据2023年5月GGII发布的报告预测，预计到2026年，人形机器人在全球服务机器人市场中的渗透率预计将达到3.5%，市场规模超过20亿美元。

各大科技公司和学术界的顶尖学者也不断涌入这一领域的研究与产品开发当中。

然而，在繁荣热潮的背后，潜在的困境却也如影随形。尽管ChatGPT等模式革命性地变革了AI领域，但它们在理解力、联想力和交互能力等方面，仍然未能完全满足公众的期望。

这促使我们对看似毫无阻碍的进步进行重新评估，同时希望经过不懈努力，人们能攻克实现真正的具身智能所面临的复杂挑战。

当机器人遇上大模型

近年来，国内多家企业发布了自主研发的人形机器人。人形机器人是所有机器人里最复杂的一类，“具身智能”对机器人来说意味着什么？当大模型和机器人相结合，会发生哪些变化？

在“具身智能”的状态下，机器人具备自主学习和计划能力，遇到障碍和困难可以自主反应、快速解决。

目前国内已有200多个大模型，实际上人形机器人是一个载体，当大模型和人形机器人相结合时，机器人可以帮助AI大模型感知物理世界，操作环境上下文；机器人利用多模态感知控制自己的身体，完成复杂的任务。

2023年上半年，以ChatGPT为代表的大语言模型爆炸式“出圈”，大语言模型以及结合视觉等多种传感器的复杂多模态模型的成熟，是实现机器人完成具身智能的关键先决条件。

最为关键的一点是，成熟的“AI大模型”使机器人可以从程序执行导向转向任务目标导向，向通用机器人的发展迈出坚实步伐。

通俗点来说，“大模型”与机器人的融合，让发展已久的机器人能真正地长出“脑子”。

机器人的“云大脑”通过在云、边、端分布式算法、算力和大数据形成机器人智能，通过 5G等无线安全高速网络连接云端大脑和机器人本体：机器人本体在“端”侧完成各种任务。

云端大脑通过人工增强、多模态融合AI和数字生成等先进技术，实现机器人智能地自我学习、不断进化与成长。

AI真正赋能到各行各业、智能机器人走进千家万户的时代正在到来，伴随着技术的突破带来性价比提高，在未来，具身智能渗透率将有望加速提升。

根据高盛预测，在理想状态下，若机器人软硬件在短期内产生重大技术突破，实现具身智能的同时年均降本达到20%，人形机器人全球市场空间有望在2035年达到1540亿美元，接近2021年智能汽车的市场空间，2025-2035年复合增长率达到94%。

若是在乐观情况下，人形机器人的出货量有望在2035年达到100万台，市场空间2025-2035年复合增长率有望达到59%。

人形机器人的时代

正在到来

2023年11月2日，工信部印发《人形机器人创新发展指导意见》（以下简称《意见》）为人形机器人发展指明方向。

《意见》中指出，到2025年，人形机器人创新体系初步建立，“大脑、小脑、肢体”等一批关键技术取得突破，确保核心部组件安全有效供给。整机产品达到国际先进水平，并实现批量生产。

2024年1月17日，AI研究实验室Midjourney创始人大卫·霍尔茨（David Holz）在社交媒体的一篇帖子写道：“我们有理由期待，到2040年，地球上将有10亿个人形机器人。到2060年，世界上将会有1000亿人形机器人。”这预示着人形机器人的新时代正在到来。

近年来，具身智能在学术界的关注度持续升温，在CoRL（机器人学习大会）上，具身智能领域的论文数量呈现出快速增长的趋势。

而在2023年初举行的 IROS（智能机器人及系统国际会议）上，具身智能也被作为一个极为重要的议题进行了深入探讨。

在2023年8月18日的世界机器人大会人形机器人技术与产业发展论坛上，2000年图灵奖获得者、中国科学院院士、清华大学交叉信息研究院院长姚期智指出，通用人工智能（AGI）的未来发展需要具备具身实体，与真实物理世界交互以完成各种任务。

只有这样，才能为产业带来更大的价值。

随着中国社会老龄化程度将逐渐加深，劳动力短缺问题日益凸显，同时中国制造业劳动力总量下降，人工成本上升，因此“机器替代人”成为了重要趋势。

目前，全球工业机器人部署量稳定增长，中国已成为世界最大的机器人市场。人形机器人在结构上与人类相似，未来有望覆盖、替换所有原本需要人类劳动力的作业场景。

根据赛迪顾问的报告，尽管目前各家人形机器人仍处于原型机研发的早期阶段，但是其带来的潜在技术变革以及对某些生产生活场景的改变值得高度关注。

人形机器人在制造业、航天探索、生活服务业、高校科研等领域具有较大的发展潜力，预计到2025年，人形机器人将有望实现在制造业场景应用的突破，小批量应用于电子、汽车等生产制造环境。

在中国，智能制造领域将成为人形机器人首个实现大规模应用的领域。人形机器人将围绕工业制造、商用服务和家庭陪伴三大场景，重新定义人工智能时代的工人，把人类从重复性劳动中解放出来。

商用服务场景是人形机器人最快应用的市场，而家庭落地场景则是人形机器人最具潜力的应用市场。

近日，美国科技公司英伟达宣布成立通用具身智能体研究实验室GEAR。

去年以来，包括中国电科21所、智元机器人、科大讯飞、小鹏汽车、傅利叶智能在内的多家国内企业相继发布了自主研发的具身智能机器人，并有多家企业拟在今年实现具身智能的商业化落地。

业界普遍认为，2024年有望成为具身智能商业落地元年。

虚拟世界，与现实世界形成鲜明对比，提供了一个更为精密和可控的环境，使得智能体能够进行更加大胆和创新的行为。

这不仅是对人类智能的延伸，更是一个通用人工智能诞生和发展的舞台，为超越人类智能水平的AI提供了理想的试验场和成长空间。

或许，这也是各大科技公司对具身智能与虚拟世界寄予厚望的深层次原因。

这预示着，一个更加智能、更加互联的未来正向我们走来

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

学习计划：

阶段1：1-2个月，建立AI大模型的基础知识体系。
阶段2：2-3个月，专注于API应用开发能力的提升。
阶段3：3-4个月，深入实践AI大模型的应用架构和私有化部署。
阶段4：4-5个月，专注于高级模型的应用和部署。

这份完整版的大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

在这里插入图片描述

bagell

关注

17
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
造完“大模型”，“具身智能”将引领AI下一个浪潮？

资深机器人专家Eric Jang不久前曾预言：“ChatGPT 曾在一夜之间出现。我认为，有智慧的机器人技术也将如此。3月13日深夜，一段人形机器人的视频开始热传。在视频中，Figure的人形机器人，可以完全与人类流畅对话，理解人类的意图，同时还能理解人的自然语言指令进行抓取和放置，并解释自己为什么这么做。而其背后，就是OpenAI为其配置的大型语言模型。由于OpenAI模型还支持多模态输入，因此可为Figure提供高级视觉和语言智能。而Figure本身，成立于2022年。
复制链接

扫一扫