大语言模型在交通领域的应用分析

15005e4a85e69680a41b2b54c21ea7cd.jpeg

 

大语言模型在交通领域的研究进展

   

8045f9067c69ebac259af2b575dce795.jpeg

前言:

大语言模型(Large Language Models, LLMs)如 GPT (Generative Pre-trained Transformer) 系列,BERT (Bidirectional Encoder Representations from Transformers) 和其他基于 Transformer 的模型,近年来在人工智能领域取得了显著的进展。这些模型通过在大规模文本数据上进行预训练,学习了语言的深层次结构和语义,从而能够在没有特定任务训练的情况下,完成多种语言理解和生成任务。

LLM的强大能力使其在如金融、法律、交通、教育等领域得到了广泛的探索和应用。目前在交叉领域对LLM的研究和应用从方法的角度来说可以分为两块:

  1. LLM Agent:将LLM塑造为决策智能体,利用提示词工程(Prompt Engineering)提升其决策能力。
  2. LLM微调是指将LLM视为编码器对输入特征进行特征提取,之后连接全连接层,针对特定任务进行微调。

下面我们将从上述提到的两个方向来对交通领域使用LLM的研究进行简单介绍。

LLM Agent

[TIV 2024] DriveLLM: Large Language Models 引领全自动驾驶之路。

00ad7a2baf88e637cec511bb28432ab4.jpeg

这篇文章探讨了名为DriveLLM的决策框架,它将大型语言模型(LLMs)与自动驾驶技术结合,以实现常识推理。以下是本文的重点和贡献:

  1. "DriveLLM,革新之选。它摒弃了传统自动驾驶决策系统中常识推理的空白,让系统在陌生环境中识别风险并洞悉他人意图。"
  2. 实地案例研究揭示:该框架在处理复杂场景(包括困难的边缘案例)方面胜过传统决策方法,专业且简洁的文章令人信服。
  3. 实证评估:通过实证评估显示,该框架能够正确响应复杂的人类指令。

总的来说,DriveLLM通过运用常识推理和优化反馈机制,显著提高了自动驾驶决策系统在复杂动态环境中的性能和稳定性。

5984523ccc7d5c23c7d54794660d8203.jpeg

[arXiv 2024] "LLM-Assisted Light: Harnessing the Power of Large Language Models for Human-Imitative Traffic Signal Control in Urban Chaos"

cbbfc7a312d203649d82537d9f35c52f.jpeg

针对大城市中的交通拥堵问题提出了一种创新的方法,将大语言模型(LLMs)引入到交通信号控制(TSC)系统中,以应对传统TSC系统在处理复杂和多变的城市交通流时的不足。传统的TSC系统主要基于规则算法或强化学习(RL),在应对不熟悉的场景时适应能力有限,导致在管理城市交通流的复杂性和多样性方面表现不足。

本文提出了一种混合框架,将LLMs与一套感知和决策工具相结合,使其能够处理静态和动态的交通信息。LLMs在决策过程中处于核心位置,结合外部交通数据和已有的TSC方法进行决策。研究开发了一个模拟平台来验证所提出框架的有效性。模拟结果表明,该系统在不需要额外训练的情况下,能够适应多种交通环境。

特别是在传感器故障(SO)情况下,所提出的方法通过减少平均等待时间,显著优于传统的RL系统。这项研究在TSC策略方面取得了显著进展,展示了LLMs在实际动态交通管理中的潜力,预示着它们可能会革新未来的交通管理系统。

"2024年arXiv论文探讨了如何将空间优化与大型语言模型相结合,以实现开放域城市行程规划。通过这种方法,我们可以更有效地规划城市旅行路线,提高出行效率。"

8561d82ef90e14d9007f81f46c62439c.jpeg

这篇研究首次提出了开放域城市行程规划(OUIP)的任务,直接根据用户用自然语言描述的需求生成行程。OUIP不同于传统的行程规划,它允许用户表达更详细的需求,实现真正的个性化。尽管大语言模型(LLMs)在处理各种任务上表现出潜力,但由于无法实时获取信息、知识不完整以及缺乏空间意识,它们无法独立提供令人满意的OUIP体验。为此,本文提出了ItiNera,一个结合空间优化和LLMs的OUIP系统,为用户提供基于需求定制的城市行程服务。具体来说,作者开发了一个基于LLM的流程,用于提取和更新兴趣点(POI)特征,创建用户专属的POI数据库。

对于每个用户请求,作者利用LLM与基于嵌入的模块协作,从用户的POI数据库中检索候选POI,然后使用空间优化模块对这些POI进行排序,最后由LLM生成个性化且空间连贯的行程。这项研究首次将LLMs集成到行程规划解决方案中。大量离线数据集实验和在线主观评估表明,该系统在提供响应性和空间连贯的行程方面优于当前的LLM解决方案。该系统已在TuTu在线旅游服务中部署,并吸引了成千上万的用户进行城市旅行规划。

[TIV 2023] VistaGPT:一种用于智能运输自动化车辆的生成式并行Transformer技术,助力实现交通智能化。

b9702186e62c6e5f4479aac5426830be.jpeg

这项研究针对异构车辆自动化系统在技术共享和系统泛化能力方面的挑战,提出了一个基于Transformer的统一框架VistaGPT。VistaGPT由车辆Transformer模块联合体(M-FoV)和自动驾驶系统自动组合(AutoAuto)组成,旨在克服系统和模块层面的信息障碍。M-FoV以模块化方式收集和组织基于Transformer的模型,提供多样性和灵活性以促进系统集成。AutoAuto利用大语言模型(LLMs),采用“分解与重组”策略,自动组合端到端的自动驾驶系统。

此外,研究部署了场景工程系统评估组合系统,并通过联邦智能贡献多样化的训练样本和应用,为AutoAuto的优化提供系统反馈。凭借其容量、可扩展性和多样性,VistaGPT为交通自动化提供了一种新范式,促进了虚拟与现实交互的并行驾驶,并推进了“6S”目标的实现。

2014e1001d065f29068151aa437d9bd0.jpeg

"TIV 2024" 揭示了一款名为 "ChatGPT-Based Scenario Engineer" 的创新工具,该工具为轨迹预测提供了全新的场景生成框架。

5c2bec3ddf3c581eacc405388684b2a3.jpeg

针对智能车辆领域的挑战,SeGPT创新框架应运而生。借助ChatGPT的强大能力,SeGPT通过定义轨迹场景和设计提示工程,成功生成复杂且富有挑战性的场景。结合“三模式”、基础模型、车辆操作系统及其他先进基础设施,SeGPT为实现更高水平的自动驾驶奠定了坚实基础。实验结果显示,SeGPT在生成多样化场景方面表现卓越,极大地推动了轨迹预测算法的发展。

LLM 微调

c491700bc34b683a4b7506191cba809f.jpeg

"UrbanGPT: Spatial-Temporal Large Language Models (2024) revolutionize the way we approach language processing, combining both spatial and temporal dimensions for unprecedented accuracy."

8c4f127fb67c0a0d1a5eab1060c8169a.jpeg

这篇研究旨在解决时空预测中的数据稀缺问题,通过借鉴大语言模型(LLMs)的成功经验,提出了一种名为UrbanGPT的时空预测模型。UrbanGPT将时空依赖编码器与指令微调范式相结合,使LLMs能够理解复杂的时空依赖关系,从而在数据稀缺的情况下进行更全面和准确的预测。

研究通过对多个公共数据集进行广泛实验,涵盖不同的时空预测任务,验证了该方法的有效性。结果表明,UrbanGPT在各种下游城市任务中表现出色,特别是在零样本场景中,显著优于现有的最先进基线模型。这些发现展示了构建用于时空学习的大语言模型的潜力。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

### 大语言模型交通领域应用案例 #### 1. 城市交通流量预测 大语言模型被用来提升城市交通流量预测的准确性。通过分析历史交通数据、天气条件以及节假日等因素,AI大模型能够有效预估未来可能出现的交通堵塞状况,为相关部门提供了重要的决策支持工具[^3]。 例如,《中国大模型落地应用案例集》中收录了一个典型案例,展示了某大城市利用先进的算法框架处理海量实时路况信息,并结合其他外部变量来进行精准度更高的短期至中期车流变化趋势判断[^1]。 #### 2. UrbanGPT:面向时空预测的任务型大模型 一项最新研究表明,研究人员开发出了名为UrbanGPT的新颖架构,专门针对城市环境中存在的时空序列数据分析难题而设计。此模型融合了自然语言理解特定领域知识图谱的优势,不仅克服了传统方法面临的样本不足挑战,而且实现了跨多种应用场景下的高效迁移学习能力[^4]。 ```python import torch from transformers import AutoModelForSeq2SeqLM, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained('urban-gpt') model = AutoModelForSeq2SeqLM.from_pretrained('urban-gpt') def predict_traffic(input_text): inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs) result = tokenizer.decode(outputs[0], skip_special_tokens=True) return result ``` 这段代码展示了一个简单的接口函数`predict_traffic()`,它接收一段描述性的输入文本(比如关于某个地点的时间段),并通过调用预先训练好的UrbanGPT模型返回相应的交通状态估计结果。 #### 3. 利用生成对抗网络优化道路布局 除了直接参与车辆行驶路径的选择外,基于大语言模型的技术还可以间接影响基础设施的设计过程。借助于强大的图像合成能力物理仿真引擎的支持,工程师们现在可以在虚拟环境下测试不同的设计方案,评估其对整体运输效率的影响程度,进而选出最优解以指导实际施工活动[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

科技互联人生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值