概念
具身智能是指依靠物理实体通过与环境交互来实现智能增长的智能系统。
此前,人工智能主要以数字形式存在,缺乏视觉、触觉、听觉等感官体验,难以有效应对现实世界的各种情况。而具身智能通过赋予AI“身体”,与现实产生交互,使AI从数字世界走向物理世界,被认为是迈向通用人工智能的重要一步。具身智能成为当前全球人工智能领域的前沿热点,也将是下一个AI浪潮。
具身智能可拆分为“具身”+“智能”。
“具身”是指具有身体且可通过交互、感知、行动等能力来执行任务,按使用用途和场景的不同,具身智能可以有多种形态,包括各类智能机器人、自动驾驶等。机器人是具身智能的主要应用场景,其中人形机器人被认为是具身智能最理想的形态。
“智能”是指物理实体可主动进行感知、理解、推理、决策、行动等任务。与此前的机器人相比,具身智能更强调在环境中的交互能力。可见,具身智能应同时具备“本体、环境交互、智能”三要素。
AI大模型的出现与硬件成本的下降,助推具身智能向好发展。当前,学术界和业界普遍认为具身智能主要由大脑(AI大模型)、小脑(运动控制)、硬件身体三部分构成。AI大模型大幅提高了机器人的语言交互、环境感知、任务决策等关键能力,帮助机器人与人类进行对话交互并做出决策,机器人小脑则控制机器人的运动、身体感知与平衡。AI大模型并不能完全等同于机器人大脑,因为AI大模型需要经过训练、微调后才成为机器人的大脑,但在AI大模型的加持下,机器人更加“聪明”,可以执行更复杂的任务,包括炒菜、洗衣服等。
Internet AI和Embodied AI的区别?
Internet AI从互联网收集到的图像、视频或文本数据集中学习,这些数据集往往制作精良,其与真实世界脱节、难以泛化和迁移。1)数据到标签的映射。2)无法在真实世界进行体验学习。3)无法在真实世界做出影响。
Embodied AI通过与环境的互动,虽然以第一视角得到的数据不够稳定,但这种类似于人类的自我中心感知中学习,从而从视觉、语言和推理到一个人工具象( artificial embodiment),可以帮助解决更多真实问题。
应用
多家企业布局具身智能领域,推动产业快速进步。在各国政府的大力支持下,众多企业也加入具身智能领域,推动具身智能的感知、交互、决策、行动等能力持续提升。现阶段,具身智能领域的主要参与者可分为3类,即机器人企业、汽车企业、互联网科技企业。
(1)机器人企业:已拥有机器人技术的积累,近3年来不断加强机器人与人工智能技术结合,推出更加智能的各类机器人。例如,优必选人形机器人Walker S在2024年4月接入百度文心大模型进行任务调度应用开发,进一步探索AI大模型+人形机器人的创新应用;
(2)汽车企业:自动驾驶汽车属于具身智能的一种形态,在自动驾驶技术进步使成本不断降低的背景下,以萝卜快跑为代表的自动驾驶汽车已逐步开始商业化。同时,部分汽车企业也自研机器人,如特斯拉自研的Optimus人形机器人,预计将在2025年部署到工厂;
(3)互联网科技企业:该类企业拥有较强的资金实力,且视觉感知、算法、虚拟仿真等软件方面具有明显的优势,可选择直接布局具身智能赛道,或通过投资的形式间接布局该赛道。例如,腾讯通过RoboticsX机器人实验室研究多模态大模型与机器人的融合,小米通过自研CyberOne人形机器人直接布局具身智能领域,微软、OpenAI、亚马逊、三星等多家企业则参与投资人形机器人初创企业Figure。
政策
在国家层面上,工业和信息化部在2023年10月出台《人形机器人创新发展指导意见》,《意见》明确指出到2025年,人形机器人创新体系初步建立,突破一批“大脑、小脑、肢体”关键技术,确保核心部组件安全有效供给,整机产品达到国际先进水平;到2027年,人形机器人技术创新能力显著提升,形成安全可靠的产业链供应链体系,构建具有国际竞争力的产业生态,综合实力达到世界先进水平。此外,2023年12月29日,应急管理部和工业和信息化部印发《关于加快应急机器人发展的指导意见》,《意见》提出到2025年,研发一批先进应急机器人,并建立一批重点场景应急机器人实战测试和示范应用基地;主要任务包括加强应急机器人急需技术攻关,提高机器人载荷功能及模块化水平,提升机器人控制及智能化水平。
北京作为人工智能领先城市,也在持续加码推进具身智能领域的发展。2023年5月21日,北京市人民政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,提出突破人工智能前沿基础理论创新围,围绕多模态智能、决策智能、具身智能等方向开展研究布局,形成具有国际影响力的人工智能原创理论体系。此外,在2023年5月30日,印发了《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》,其中便提出探索具身智能、通用智能体和类脑智能等通用人工智能新路径,包括推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。据悉,北京海淀区将打造全国具身智能原始创新策源地。2024年4月28日,北京海淀区发布《打造全国具身智能创新高地三年行动方案》,《方案》以大模型等人工智能技术突破为引领,重点聚焦具身大模型和机器人整机,部署6大行动,力争到2026年初步建成全国具身智能原始创新策源地、应用示范新高地和产业加速集聚地,成为我国参与全球具身智能竞争的核心力量。
(以上内容均来源于网络)