交通 | 大语言模型在交通领域的研究进展

前言:

大语言模型(Large Language Models, LLMs)如 GPT (Generative Pre-trained Transformer) 系列,BERT (Bidirectional Encoder Representations from Transformers) 和其他基于 Transformer 的模型,近年来在人工智能领域取得了显著的进展。这些模型通过在大规模文本数据上进行预训练,学习了语言的深层次结构和语义,从而能够在没有特定任务训练的情况下,完成多种语言理解和生成任务。LLM的强大能力使其在如金融、法律、交通、教育等领域得到了广泛的探索和应用。目前在交叉领域对LLM的研究和应用从方法的角度来说可以分为两块:

  1. LLM Agent:将LLM视为决策智能体,使用提示词工程(Prompt Engineering)辅助智能体进行决策。

  2. LLM微调:将LLM视为编码器对输入特征进行特征提取,之后连接全连接层,针对特定任务进行微调。

下面我们将从上述提到的两个方向来对交通领域使用LLM的研究进行简单介绍。

LLM Agent

[TIV 2024] DriveLLM: Charting the Path Toward Full Autonomous Driving With Large Language Models

这篇论文介绍了一个名为DriveLLM的决策框架,该框架将大语言模型(LLMs)与现有的自动驾驶技术结合,以实现决策中的常识推理。以下是本文的主要内容和贡献:

  1. 常识推理:DriveLLM弥补了传统自动驾驶决策系统中缺乏常识推理能力的不足,使系统能够在不熟悉的场景中预测危险并理解其他道路使用者的意图。

  2. 网络物理反馈系统:DriveLLM引入了一个独特的网络物理反馈机制,使得系统可以从自身的错误中学习和改进。

  3. 实地案例研究:在实际案例研究中,该框架在处理复杂场景(包括困难的边缘案例)方面表现优于传统的决策方法。

  4. 人与系统的交互:提出了一种新颖的方法,使决策系统能够与人类输入进行交互,同时防范对抗性攻击。

  5. 实证评估:通过实证评估显示,该框架能够正确响应复杂的人类指令。

总的来说,DriveLLM通过引入常识推理和改进的反馈机制,提升了自动驾驶决策系统在复杂和动态环境中的表现和可靠性。

[arxiv 2024] LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments

这篇文章针对大城市中的交通拥堵问题提出了一种创新的方法,将大语言模型(LLMs)引入到交通信号控制(TSC)系统中,以应对传统TSC系统在处理复杂和多变的城市交通流时的不足。传统的TSC系统主要基于规则算法或强化学习(RL),在应对不熟悉的场景时适应能力有限,导致在管理城市交通流的复杂性和多样性方面表现不足。本文提出了一种混合框架,将LLMs与一套感知和决策工具相结合,使其能够处理静态和动态的交通信息。LLMs在决策过程中处于核心位置,结合外部交通数据和已有的TSC方法进行决策。研究开发了一个模拟平台来验证所提出框架的有效性。模拟结果表明,该系统在不需要额外训练的情况下,能够适应多种交通环境。特别是在传感器故障(SO)情况下,所提出的方法通过减少平均等待时间,显著优于传统的RL系统。这项研究在TSC策略方面取得了显著进展,展示了LLMs在实际动态交通管理中的潜力,预示着它们可能会革新未来的交通管理系统。

[arxiv 2024] Synergizing Spatial Optimization with Large Language Models for Open-Domain Urban Itinerary Planning

这篇研究首次提出了开放域城市行程规划(OUIP)的任务,直接根据用户用自然语言描述的需求生成行程。OUIP不同于传统的行程规划,它允许用户表达更详细的需求,实现真正的个性化。尽管大语言模型(LLMs)在处理各种任务上表现出潜力,但由于无法实时获取信息、知识不完整以及缺乏空间意识,它们无法独立提供令人满意的OUIP体验。为此,本文提出了ItiNera,一个结合空间优化和LLMs的OUIP系统,为用户提供基于需求定制的城市行程服务。具体来说,作者开发了一个基于LLM的流程,用于提取和更新兴趣点(POI)特征,创建用户专属的POI数据库。对于每个用户请求,作者利用LLM与基于嵌入的模块协作,从用户的POI数据库中检索候选POI,然后使用空间优化模块对这些POI进行排序,最后由LLM生成个性化且空间连贯的行程。这项研究首次将LLMs集成到行程规划解决方案中。大量离线数据集实验和在线主观评估表明,该系统在提供响应性和空间连贯的行程方面优于当前的LLM解决方案。该系统已在TuTu在线旅游服务中部署,并吸引了成千上万的用户进行城市旅行规划。

[TIV 2023] VistaGPT: Generative Parallel Transformers for Vehicles With Intelligent Systems for Transport Automation

这项研究针对异构车辆自动化系统在技术共享和系统泛化能力方面的挑战,提出了一个基于Transformer的统一框架VistaGPT。VistaGPT由车辆Transformer模块联合体(M-FoV)和自动驾驶系统自动组合(AutoAuto)组成,旨在克服系统和模块层面的信息障碍。M-FoV以模块化方式收集和组织基于Transformer的模型,提供多样性和灵活性以促进系统集成。AutoAuto利用大语言模型(LLMs),采用“分解与重组”策略,自动组合端到端的自动驾驶系统。此外,研究部署了场景工程系统评估组合系统,并通过联邦智能贡献多样化的训练样本和应用,为AutoAuto的优化提供系统反馈。凭借其容量、可扩展性和多样性,VistaGPT为交通自动化提供了一种新范式,促进了虚拟与现实交互的并行驾驶,并推进了“6S”目标的实现。

[TIV 2024] ChatGPT-Based Scenario Engineer: A New Framework on Scenario Generation for Trajectory Prediction

这项研究针对智能车辆(IV)领域中场景获取效率、多样性和复杂性不足的问题,提出了一个名为SeGPT的创新框架,用于生成复杂和具有挑战性的场景。SeGPT借助ChatGPT,通过定义轨迹场景和设计提示工程来生成多样化的场景。结合“三模式”、基础模型、车辆操作系统及其他先进基础设施,SeGPT有望实现更高水平的自动驾驶。实验结果表明,SeGPT在生成多种多样的场景方面表现出色,显著促进了轨迹预测算法的发展。

LLM 微调

[arxiv 2024] UrbanGPT: Spatio-Temporal Large Language Models

这篇研究旨在解决时空预测中的数据稀缺问题,通过借鉴大语言模型(LLMs)的成功经验,提出了一种名为UrbanGPT的时空预测模型。UrbanGPT将时空依赖编码器与指令微调范式相结合,使LLMs能够理解复杂的时空依赖关系,从而在数据稀缺的情况下进行更全面和准确的预测。研究通过对多个公共数据集进行广泛实验,涵盖不同的时空预测任务,验证了该方法的有效性。结果表明,UrbanGPT在各种下游城市任务中表现出色,特别是在零样本场景中,显著优于现有的最先进基线模型。这些发现展示了构建用于时空学习的大语言模型的潜力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值