LanguageMPC: 自动驾驶中大语言模型作为决策器

23年10月来自国内清华大学、香港大学和加州伯克利分校的论文“LanguageMPC: Large Language Models As Decision Makers For Autonomous Driving“。

现有的基于学习的自动驾驶系统在理解高级信息、泛化到罕见事件和提供可解释性方面面临挑战。为了解决这些问题,该文将大语言模型(LLM)作为需要人类常识理解的复杂AD场景决策组件。设计了认知途径,实现LLM的全面推理,并开发了将LLM决策转化为可操作驾驶命令的算法。这种方法通过引导参数矩阵的自适应,把LLM决策与低级控制器无缝集成。

这个以LLM为核心的高级决策AD系统,如图所示(a)。LLM根据提供的提示启动对话,不断从环境中收集信息,进行推理并做出判断。如图(a)的中心所示,LLM从左到右依次进行:1)识别需要注意的车辆,2)评估情况,3)提供动作引导。然后,系统将这三个高级文本决策转换为数学表示,即观察矩阵、权重矩阵和动作偏差。这些元素充当底层控制器MPC的指令,指令其采取具体的驾驶行动。

以十字路口左转的情况为例,在图(b)展示了如何将上述三个高级文本决策转换为MPC所需的数学表示。LLM选择“车辆26”,用MPC的观测算子创建相应的向量,并将观测矩阵中的其他元素清零,仅关注“车辆26’”。根据LLM发信号的十字路口等待情况,调整权重矩阵,使减速指令优先于轨迹跟从,这促使MPC根据LLM的指令迅速减速。通过预定义的规则直接将LLM的动作引导转化为动作偏差。MPC在上述三个方面的数学形式的引导下,完成了停车和让行的驾驶动作。

添加图片注释,不超过 140 字(可选)

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值