理想 VLA:好的人工智能要有边界、有道德

2025 年 5 月 7 日,理想汽车推出 “理想 AI Talk 第二季 —— 理想 VLA 司机大模型,从动物进化到人类”,理想汽车董事长兼 CEO 李想重点分享了对于人工智能的最新思考,VLA 司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。

李想将 AI 工具分为三个层级,分别是信息工具、辅助工具和生产工具。目前,大多数人将 AI 作为信息工具使用,但信息工具常伴随大量无效信息、无效结果和无效结论,仅具参考价值。成为辅助工具后,AI 可以提升效率,例如现在的辅助驾驶,但仍需人类参与。未来,AI 发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。

李想表示:“判断 Agent(智能体)是否真正智能,关键在于它是否成为生产工具。只有当人工智能变成生产工具,才是其真正爆发的时刻。就像人类会雇佣司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。”

VLA 的实现不是突变的过程,是进化的过程

目前的 L2、L2 + 组合驾驶辅助仍属于辅助工具阶段,而 VLA(Vision - Language - Action Model,视觉语言行动模型)能够让 AI 真正成为司机,成为交通领域的专业生产工具。对理想汽车而言,未来的 VLA 就是一个像人类司机一样工作的司机大模型”。

VLA 的实现不是一个突变的过程,是进化的过程,经历了三个阶段,对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段,理想汽车自 2021 年起自研依赖规则算法和高精地图的辅助驾驶,类似 “昆虫动物智能”。第二阶段,理想汽车自 2023 年起研究,并于 2024 年正式推送的端到端 + VLM(Vision Language Model,视觉语言模型)辅助驾驶,接近 “哺乳动物智能”。

端到端模型在处理复杂问题时存在局限,虽可借助 VLM 视觉语言模型辅助,但 VLM 使用开源模型,使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。为了解决这些问题并提升用户的智能体验,理想汽车自 2024 年起开展 VLA 研究,并在多项顶级学术会议上发表论文,夯实了理论基础。

在端到端的基础上,到第三阶段,VLA 将开启 “人类智能” 的阶段。它能通过 3D 和 2D 视觉的组合,完整地看到物理世界,而不像 VLM 仅能解析 2D 图像。同时,VLA 拥有完整的脑系统,具备语言、CoT(Chain of Thought,思维链)推理能力,既能看,也能理解并真正执行行动,符合人类的运作方式。

VLA 训练过程模拟人类学习,对齐人类价值观

VLA 的训练分为预训练、后训练和强化训练三个环节,类似于人类学习驾驶技能的过程。预训练相当于人类学习物理世界和交通领域的常识,通过大量高清 2D 和 3D Vision(视觉)数据、交通相关的 Language(语言)语料,以及与物理世界相关的 VL(Vision - Language,视觉和语言)联合数据,训练出云端的 VL 基座模型,并通过蒸馏转化为在车端高效运行的端侧模型。

后训练相当于人类去驾校学习开车的过程。随着 Action(动作)数据的加入 —— 即对周围环境和自车驾驶行为的编码,VL 基座变为 VLA 司机大模型。得益于短链条的 CoT,以及 Diffusion 扩散模型对于他车轨迹和环境的预测,VLA 具备实时性的特点,实现了在复杂交通环境中的博弈能力。

强化训练类似于人类在社会中实际开车练习,目标是让 VLA 司机大模型更加安全、舒适,对齐人类价值观,甚至超越人类驾驶水平。强化训练包含两部分:一是通过 RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)完成安全对齐,使模型遵守交通规则,贴合中国用户的驾驶习惯;二是将纯强化学习模型放入世界模型中训练,提升舒适性,避免碰撞事故,遵守交通规则。经过预训练、后训练和强化训练后,VLA 司机大模型即可部署至车端运行。

VLA 司机大模型以 “司机 Agent(智能体)” 的产品形态呈现,用户可通过自然语言与司机 Agent 沟通,跟人类司机怎么说,就跟司机 Agent 怎么说。简单通用的短指令由端侧的 VLA 直接处理,复杂指令则先由云端的 VL 基座模型解析,再交由 VLA 处理。黄历网:https://www.jimingbao.com.cn/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值