LMDrive: 基于大语言模型的闭环端到端自动驾驶

AI-Seeker

于 2024-05-06 21:28:44 发布

阅读量2.3k

点赞数 41

文章标签：语言模型人工智能自动驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l1498487239/article/details/138508738

版权

0. 资源链接

论文: LMDrive: Closed-Loop End-to-End Driving with Large Language Models
项目: https://hao-shao.com/projects/lmdrive.html

1. 背景动机

现有的自动驾驶方法存在以下问题：

适用场景局限：对常见的简单场景有效，但在长尾事件和城市复杂场景时存在挑战，易导致严重事故
交互理解局限：依赖于有限格式的输入（如传感器数据和导航航点），缺乏理解语言及与人类互动的能力
闭环评估缺失：先前研究大多针对特定模块进行开环评估，缺乏闭环评测（如累积误差、人机交互和实际执行效果等）

不过近两年大语言模型的突飞猛进为提升自动驾驶性能提供了新的可能性：

大语言模型在自然语言理解能力的提升，为系统与人类的高效交互、协作及能力互补上开辟了新的可能性
大语言模型已展现出较强的知识推理能力，能够学习并处理复杂场景中涉及逻辑推断的感知/决策等问题

2. 内容提要

提出基于语言模型的端到端闭环框架LMDrive，能够协同处理多种传感器数据（多视角图像、点云等）和语言指令

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。