交通系统速度预测综述:从车辆到交通【公共交通数据集】【开源模型整理】
分享这篇综述,希望对大家有帮助。如有错误,请多指正!
Zewei Zhou, Ziru Yang, Yuanjian Zhang, Yanjun Huang, Hong Chen, Zhuoping Yu,
A comprehensive study of speed prediction in transportation system: From vehicle to traffic,
iScience,
Volume 25, Issue 3,
2022,
103909,
ISSN 2589-0042,
https://doi.org/10.1016/j.isci.2022.103909.
(https://www.sciencedirect.com/science/article/pii/S2589004222001791)本文将交通系统中的速度预测按规模分为三类:交通速度预测(宏观)、车速预测(微观)和车道级速度预测(中观),探讨了速度预测在不同层次上的异同,以促进对速度预测的全面理解。之后文章对各种影响速度的因素,各预测方法的理论、特点及变体进行综述,也对已有评估指标进行搜集,同时整理了公共交通数据集与开源模型。
注意:本文出现的名词”交通速度预测“、”车速预测“、”车道级速度预测“以及”宏观“、”微观“、”中观“,初次观看可能会混淆,在出现这些名词的地方将会做斜体标注。
文章目录
一、速度预测
-
速度预测目的:根据当前和历史交通状态估计未来一段时间内交通参与者的速度。
-
速度预测本质:识别未来交通模式,它描述了交通运行模式以及未来速度与历史交通状态之间的关系。
-
决定预测性能的两个重要因素——模型(负责提取模式)和可用信息(预测模型的输入)。
-
此外,信息的特征直接决定了信息的质量
- 比如数据类型、来源(即定点数据、车辆轨迹数据)、格式(即标量、矢量、矩阵)和处理(即地图匹配、数据清理)等。
二、不同层次速度预测的异同
-
如图所示,给定某一范围内的预测问题,Ground Truth 可分为确定性和不确定性部分:
-
确定部分是指速度的趋势和范围,由可用信息确定。例如,正在加速的车辆的速度很可能在下一时刻增加,不可能立即减速。
-
环境因素引起的不确定性反映了交通系统的随机性和混沌性。部分不确定性是可预测的,但其余不可预测,取决于对其理解的程度。
-
-
因此,理论可预测值由不确定性部分的确定性和可预测部分组成。信息基础决定了理论预测值,并决定了预测精度的上限。
-
在实践中,用于预测的模型不可避免地包含错误,如图中的三部分错误。因此,考虑到各种背景因素,有必要增加理论预测值,而性能的提高是减少错误的关键。
在可预测性分析的背景下,每个速度预测的定义如下:
1. 交通速度预测
交通速度预测由一段时间内通过特定路段的多辆车辆的平均速度表示。道路网络的物理结构带来了对交通速度的时空依赖性,这是提高预测精度的关键。然而,如何建模依赖关系仍然是一个挑战。
空间依赖性
交通流遵循路网,路网附近空间点的速度是相互关联的。不同的空间点对预测结果的影响不同,不同时间的空间相关性也不同。空间依赖性可分为局部依赖性和全局依赖性。前者侧重于当地相邻道路,另一个则涉及整个网络的连通性。
此外,道路网络中的一个区域通常通过各种非欧几里德关系与另一个区域存在空间依赖关系,例如空间邻接、兴趣点(POI)和语义信息。如图2(A)所示,三个标记区域通过黄色路网相互连接并在空间上相邻。三个标记区域的POI属性也会影响相应的交通模式。
时间依赖性
特定点的当前速度与历史速度相关。时间依赖性是一种复杂的非线性关系,在不同的时间点上存在差异。此外,不同时间段的速度对当前速度有不同的影响。此外,交通速度在时间维度上是周期性的。例如,工作日的交通速度相似,周末不同。工作日这种相似性的一个重要表现是上午和晚上的高峰,如图2(A)所示,用红色和蓝色箭头表示。
2. 车速预测
车辆速度预测侧重于单个车辆,如图2(B)所示。车速没有直接的空间相关性。此外,车辆行为的明显不确定性带来了比交通速度更复杂的时间相关性。由于车速预测主要用于能源管理和热管理(Thermal Management),因此车速预测的特点还在于预测范围短,实时性要求严格。
3. 车道级速度预测
车道级速度预测的目的是获得车辆在一定时间内通过某一车道横断面的平均速度。图3显示了车道级别场景的简要描述。与宏观或微观速度预测不同,车道级速度预测的粒度为中尺度。这种预测的特点介于交通和车速预测之间。此外,车道层面的相互作用和时空相关性建模是该预测的挑战。
三、 影响速度预测的因素
(一)影响速度预测因素的分类
按车辆角度分类
- 车辆的内部因素
- 环境的外部因素
按是否因素恒定分类
- 静态因素
静态因素是恒定的,可以通过离线存储在线访问。
-
动态因素
动态因素随着时间的推移,各种因素会发生变化,因此对它们进行建模比对静态因素进行建模更困难,在预测时通常应同时考虑动态因素的历史和当前信息。
(二)内部因素
1. 驾驶行为 (动态)
人类驾驶员直接驾驶车辆,其驾驶行为显著影响车辆速度。所有其他因素都通过驾驶行为间接影响车速。人类驾驶员的感知和决策极其复杂,不同驾驶员的反应并不相似,即使是同一位驾驶人也会做出不同的决定。
2. 车辆信息(静态)
车辆信息是指有关车辆的静态因素,包括物理信息(车辆类型、车辆重量、乘客重量和分布)、动力系统(动力类型、传动类型)等。此外,车辆功能(如ADAS,即高级驾驶辅助系统)也属于此类信息,它根据特定规则控制车辆速度。
3. 车辆状态(动态)
上述车辆信息间接约束了车速的变化,而动态车辆状态直接影响车速。这些因素描述了车辆的运行状态,包括车速、加速度、可用燃油或功率、蓄电池温度、变速箱状态等。
(三) 外部因素
1. 交通流状态(动态)
从微观角度来看,交通流状态是指周围车辆的运动状态,前方车辆状态(即相对速度和距离)严重影响自我车辆速度。从宏观角度来看,它指的是交通状态,例如流量、速度和占用率。例如,交通拥挤可以直接影响不同程度的速度,宏观冲击波(the macroscopic shock waves)是一个影响因素。此外,交通流状态具有较强的时空相关性,应考虑历史交通流状态。
2. 天气条件(动态)
恶劣的天气条件(如雾、雨和雪)严重影响能见度和路面摩擦,从而改变驾驶行为和车辆稳定性。因此,这些因素可能会导致交通拥堵或事故,严重影响不同程度的速度。
3. 道路和交通规则(静态)
道路包括城市道路、公路、农村道路和一些功能性道路,比如十字路口、过渡段、急转弯。道路特性(即坡度、曲率和粗糙度)、环境特性(如集群、学校、医院)和交通规则(如减速丘、限速、车道特性)对速度有影响。
4. 交通信号和事件(动态)
交通事件包括交通事故、交通管制措施、社会事件(如体育赛事、考试、表演)等。交通事故可能导致拥堵,社会事件通过改变交通需求影响速度。此外,交通信号对于保持城市道路上的交通秩序至关重要,它严重限制了交通系统的速度。此外,由于实时交通管理,照明定时(lighting timing)是动态的。
(四)不同层次的因素分析
- 关于单个车辆状态的内部因素是短期预测中车辆速度的主要因素,尤其是车辆行为。此外,随着预测期的增加,内部因素的影响会减少,外部因素的影响由于其累积效应而会增加。
- 关于交通速度,通过对多辆车进行统计平均,可以减弱单辆车不确定性对宏观速度的影响。因此,与车速相比,交通速度变化平稳,内部因素对其影响较小。同时,由于外部因素的预测范围比车辆速度的预测范围长,因此外部因素成为影响交通速度的主要因素。
- 就车道级速度而言,由于其微观视角,外部因素和内部因素的影响介于宏观速度和微观速度之间。
四、交通速度预测方法
时空相关性是交通速度的主要特征,因此它是预测方法建模的重点。同时,将各种影响因素整合到模型中是预测的趋势。
具体方法就不在这过多赘述了 ,仅做简单介绍,图为交通速度预测方法的汇总。
(一)基于模型的方法
由于交通模型复杂,基于模型的方法很难保证交通速度预测的实时性要求,尤其是微观方法,尽管它们可以提供可解释的结果。此外,在面对动态流量时,人为假设和有限的专业知识可能会导致不可避免的错误。
(二)经典数据驱动方法
数据驱动方法旨在归纳识别数据背后的交通模式,并根据模式实现预测。
1. 统计方法
统计方法主要根据历史速度的时间相关性预测未来的交通速度,其中自回归综合移动平均(ARIMA)是最常用的方法。然而,随着相关点数量的增加,ARIMA及其变体的计算量越来越大。另一方面,卡尔曼滤波器(KF)用于交通速度预测,因为它们可以从实时性能良好的噪声数据中估计动态系统状态。此外,速度预测还采用了其他统计方法,如非参数回归和偏最小二乘。
由于无法处理各种因素和静态假设,统计方法过于简单,无法提取动态交通模式。因此,传统的机器学习被用于交通速度预测,它可以处理高维信息并提取复杂的交通模式,它可以大致分为四类。
2. 概率图方法
概率图方法(Probabilistic Graph Method)利用图来表示模型中变量的联合概率分布。
优点:可以有效地捕捉交通不确定性。
3. 支持向量机(SVM)
SVM通过基函数将输入空间转换为特征空间,并在特征空间中应用线性模型。SVM是一种通过在特征空间中绘制线性边界的二元线性分类器,其目标是最大化间隙宽度。因此,SVM本质上是一个凸二次规划问题,可以实现全局优化。
4. 高斯过程法
高斯过程法(Gaussian Process Method)是无限维空间中多元正态分布的推广。在交通速度预测方面,该方法主要用于交通信息融合预测,因为它可以考虑高维数据、数据异构性、不确定性和模糊性。
5. 人工神经网络(ANN)
人工神经网络(ANN)是一种由多层神经元(计算细胞)组成的加权计算网络,其灵感来源于生物大脑中的神经,由于其强大的鲁棒性,已成为交通速度预测中的一种流行方法。
(三)深度学习方法
与浅层结构的传统机器学习相比,深度学习方法不仅可以处理大规模数据,还可以提取多因素与交通速度之间的复杂模式。
1. 空间依赖性建模
CNN
卷积层应用多个卷积核来提取图像的不同局部特征。池层进一步降低了数据维度,并捕获了不同局部特征的空间依赖性。最后,完全连接的层根据特征输出结果。
CapsNet
Capsule网络(CapsNet)最近受到了大量关注,它用动态路线代替了汇集操作,并提取了路段之间更准确的空间关系。考虑到拓扑的相互关系,CapsNet适合大规模预测。采用CapsNet捕捉不同时间步长的交通网络之间的相互关系,其结果优于CNN。然而,由于CapsNet的结构更复杂,它的训练比CNN花费更多的时间。
GCN
大致分两类:
-
光谱GCN(SGCN)
定义了光谱域中的卷积,并通过图形傅里叶变换将交通数据传输到此域。
-
Diffusion GCN (DGCN)
基于图节点之间的空间结构定义图卷积。这种方法假设信息以转移概率从一个节点传输到相邻节点,这样在几步之后就可以达到动态平衡。
Attention
注意力机制核心是一组注意分配系数。在空间依赖性方面,注意机制可以通过学习不同的道路单位权重,明确突出对速度影响较大的道路。此外,多头注意可以捕获不同子空间中的特征,提高预测精度,近年来受到了广泛关注。
2. 时间依赖性建模
RNN
RNN的每个计算步骤都将返回结果作为输入,下一步的结果由新输入和以前的结果决定。交通数据的常见格式是序列时间序列,因此RNN是提取时间相关性的理想候选。然而,经典的RNN由于循环计算中参数的逐渐减少或增加而导致网络梯度的衰减或爆炸,导致无法在序列中长期存储。
LSTM
为了克服RNN无法在序列中长期存储的挑战,研究人员提出通过在RNN隐藏层中添加一个门控制单元来实现长短期记忆网络(LSTM)。LSTM包括三个们:遗忘门、输入门和输出门,在每个步骤中选择和存储重要信息以考虑长期信息。
GRU
为了克服LSTM三门结构导致了较高的计算成本的挑战,一种简单的RNN变体,门递归单元(GRU)受到了极大的关注,它将LSTM的门控制单元简化为两个门(重置门、更新门),并且在实践中可以实现与LSTM相似的性能。
Attention
注意机制可以提取输入的关键部分,而不是将所有信息编码为矢量输入。为了捕获动态时间依赖,注意力机制引起了广泛的兴趣。
CNN
尽管RNN在时间依赖建模中很流行,但它的计算成本很高。相反,CNN可以通过并行计算促进训练。
TCN
由于卷积核的大小,经典的CNN无法很好地捕获长期的时间依赖性。因此,与RNN相比,它通常被视为不适用于序列数据的方法。然而,CNN具有计算优势,于是提出了一种CNN变体,即时间卷积网络(TCN),用于模拟序列数据。卷积结果中的时间卷积数据,称为感受野(receptive field)。为了扩大感受野的大小,扩张因果卷积作为TCN的核心,对输入采用间隔采样策略,其中感受野大小可以随着层数的增加呈指数增长。因此,TCN可以获得较少层次的长感受野,成为时间依赖建模的候选对象。此外,TCN是从CNN发展而来的,它克服了RNN中梯度衰减或爆炸的主要问题。
3. 时空依赖性建模
空间依赖建模的主流是卷积方法,时间依赖流行的是序列模型。捕捉时空依存关系的简单方法是连接用于提取不同特征的方法,其中RNN和GCN组是最流行的。
然而,时间和空间特征在本质上并不是独立的。不同时间步长的空间依赖性不同,空间结构也是时间依赖性的重要因素。忽略空间和时间特征之间的相互关系是上述方法的一个明显局限性,而深度学习方法由于其在特征提取方面的优异性能成为该问题的一个很有前景的方向。
4. 外部因素建模
时空相关性建模是现有工作的重点,但有必要考虑造成随机交通波动的外部影响因素。这些因素可以与时空学习网络相结合,或者由一个附加模块捕获。天气状况和时间信息通常一起考虑,道路特征和POI则是空间依赖性的重要因素。
5. 深度学习局限性
- 深度学习方法需要输入大量数据,并且一些重要场景的数据很难收集,例如事故场景。
- 由于数据需求量大、模型结构复杂,培训成本也很高。
- 由于考虑了更多的因素,计算复杂性可能会迅速增加。
- 由于黑箱特性,与经典方法相比,此类方法的可解释性仍然是一个巨大的问题。
五、车速预测方法
车速预测方法也可分为基于模型、经典数据驱动和深度学习方法,如图所示。
必须注意的是,车速是不同层次上最不确定的变量。
- 一方面,车速直接受其内部因素的影响,很难对复杂的驾驶行为进行建模。
- 另一方面,外部因素也会间接影响车速。
- 此外,如果没有网络作为参考,车辆速度的空间相关性不是很明显。
由于其最短的预测时间和不同级别之间的实时性要求,在车辆速度预测中采用较简单的模型至关重要。同时,由于车辆状况的多样性和驾驶行为的不确定性,这些预测方法的适应性比其他级别的速度预测更为重要。
(一) 基于模型的方法
基于模型的方法解释性强,实现简单,适用于车速预测。根据提议的假设,基于模型的方法可分为朴素模型和高级模型。
1. 基于模型的朴素方法
原始模型通常使用车辆速度或加速度的简单规则来描述车辆的运动。此类模型仅基于实时车辆信息,可分为三类:恒速模型、恒加速度模型和指数模型。
2. 基于模型的高级方法
基于模型的方法的关键是对驾驶行为建模,它反映了驾驶员对环境的反应。朴素的模型通常只考虑了较少的车辆内部因素,并过分简化了驾驶行为。随着自动车辆和V2X的发展,先进的模型(即跟车模型和生态驾驶模型)受到了极大的关注,它可以模拟各种外部因素,如交通灯信息、周围车辆信息。
此外,精度的提高意味着计算成本的增加,V2X信息需要相应的设备。因此,在高级模型中应考虑实时性和信息可用性。
(二) 经典数据驱动方法
数据驱动方法不需要对理论模型进行任何校准,并且比基于模型的方法显示出更好的准确性。经典的数据驱动方法也可以分为统计方法和传统的机器学习方法。
1.经典统计方法
2.传统机器学习
马尔可夫(Markov)
这种方法可以根据马尔科夫理论预测未来时刻的状态变化。马尔可夫过程是一个从一个状态过渡到另一个状态的随机过程,下一个状态的概率分布只取决于当前状态而不是之前的序列。基于加速度和速度的状态转换,动态驾驶过程很容易被建模为马尔可夫过程,驾驶的不确定性可以通过其简单的模型结构来考虑。
人工神经网络(ANN)
ANN是一种流行的车速预测方法,尤其是长期预测方法,通常优于马尔可夫和基于模型的方法。同时,与深度学习方法相比,人工神经网络的浅层结构成为其在车速预测中的优势,从而可以在精度和计算成本之间取得平衡。
(三) 深度学习方法
深度学习方法可以捕获大数据背后的复杂模式,通常比其他方法获得更准确的结果。同时,在车速预测的实时性要求下,计算和存储成本高的缺点也日益突出。然而,深度学习方法仍然是车辆速度预测的趋势,有必要继续深入研究。
六、车道级速度预测方法
道路上行驶的每辆车都受到车道边界的限制。车道间交通流的相互作用会显著影响每辆车的速度。有必要从中观的角度提供每条车道的车道级速度信息。车道级速度预测的研究仅在最近几年才受到关注。因此,本节主要阐述车道级速度预测的描述和意义,并回顾中尺度的预测方法。
(一) 车道级速度预测说明
与交通速度预测相比,车道级速度预测解除了交通速度预测方法对道路上多车道采用相同交通模式的假设。一方面,由于位置不同,同一条道路的不同车道具有不同的功能和限制。另一方面,由于它们之间的相互作用,车道交通模式与同一条道路上其他车道的模式相关。
车道级交通的时空特征以及车道之间的相互作用给这一预测带来了挑战和机遇。对于车道级速度预测的应用,它不仅为交通管理提供了细粒度的未来交通状态,还帮助车辆选择合适的车道和规划最佳行驶路径。
如图5所示,本文表示立交桥和合并车道前一天和一周内的车道水平速度。数据源为数据集PeMS,周速度数据的采样时间为每天12:00。图中用虚线框标记的两个场景的观察点同时检测到不同车道的平均速度。以场景A为例,观察点有三条车道,即车道1、2和3,如图3所示。在立交桥前,它们之间的车道级速度差一天内可达15.6%,在融合道路前不同车道的速度差一周内可达28.9%。同时,不同车道水平速度的趋势是相似的。因此,特定道路上不同车道的交通模式不同,但与相邻车道相关。
(二) 车道级速度预测方法
与交通和车速预测相比,车道级速度预测是一个新的研究领域。现有的车道级速度预测研究主要集中在深度学习方法上。由于车道的尺寸,车道级交通速度比其他级别的速度更难处理。为了简化问题,一种流行的方法是根据时间或车道划分数据。
车道级速度通常采用多通道时空图像(multi-channel image),可以表示道路沿线的时空维度信息以及车道之间的空间信息。此外,交通特性的特征相似,因此多通道图像能够考虑交通特性的影响。
-
Raza, A., and Zhong, M. (2017). Hybrid lane-based short-term urban traffic speed forecasting: a genetic approach. In 2017 4th International Conference on Transportation Information and Safety (ICTIS) (IEEE), pp. 271–279. https://doi.org/10.1109/ICTIS.2017.8047776.
考虑了峰值或非峰值条件,并利用遗传算法优化预测参数。然后,采用人工神经网络和局部加权回归模型预测不同条件下的车道级速度。
-
Tao, L., Gu, Y., Lu, W., Rui, X., Zhou, T., and Ding, Y. (2020). An Attention-Based Approach for Traffic Conditions Forecasting Considering Spatial-Temporal Features. In 2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE), pp. 117–122. https://doi.org/10.1109/ICITE50838.2020.9231367.
使用注意力模型提取重要特征,并根据不同的车道和时间分配权重。
-
Ke, R., Li, W., Cui, Z., and Wang, Y. (2018). Multilane traffic pattern learning and forecasting using convolutional neural network. In COTA International Symposium on Emerging Trend in Transportation, p. 8.
处理图像数据是CNN的优势,因此CNN更倾向于使用多通道图像输入进行预测。
-
Ke, R., Li, W., Cui, Z., and Wang, Y. (2020b). Twostream multi-channel convolutional neural network for multi-lane traffic speed prediction considering traffic volume impact. Transportation Res. Rec. 2674, 459–470.
模型构造与上一个相似,它将车道级速度和流量数据转换为具有多通道的时空矩阵,以输入CNN。
上述四个模型都是分别提取车道级时空特征建模车道级时空相关性。
-
Lu, W., Rui, Y., and Ran, B. (2020a). Lane-level traffic speed forecasting: a novel mixed deep learning model. IEEE Trans. Intell. Transportation Syst. 1–12.
引入了Conv LSTM结构来高效、同时地提取时空相关性,多通道图像适合描述时空相关性。
-
Lu, W., Rui, Y., Yi, Z., Ran, B., and Gu, Y. (2020b). A hybrid model for lane-level traffic flow forecasting based on complete ensemble empirical mode decomposition and extreme gradient boosting. IEEE Access 8, 42042–42054. https://doi.org/10.1109/ACCESS.2020.2977219
采用随机森林方法提取时间相关性的重要性并简化输入,然后使用clockwork RNN捕获时间特征。
-
Gu, Y., Lu, W., Qin, L., Li, M., and Shao, Z. (2019b). Short-term prediction of lane-level traffic speeds: a fusion deep learning model. Transportation Res. Part C: Emerging Tech. 106, 1–16. https://doi.org/10.1016/j.trc.2019.07.003.
通过基于熵的灰色关联分析提取空间特征,并通过相关分析方法选择影响最大的车道段。
-
Guo, J., He, H., Peng, J., and Zhou, N. (2019a). A novel MPC-based adaptive energy management strategy in plug-in hybrid electric vehicles. Energy 175, 378–392. https://doi.org/10.1016/j.energy.2019.03.083
Lu, W., Yi, Z., Liu, W., Gu, Y., Rui, Y., and Ran, B.(2020c). Efficient deep learning based method for multi-lane speed forecasting: a case study in Beijing. IET Intell. Transport Syst. 14, 2073–2082.
这两篇都是训练过程分别在时间维度和空间维度上加速。
七、评估指标、公共数据集与开源模型
(一)评估指标
1. 预测范围(prediction horizon)
预测的时间范围作为一个重要前提,直接决定了预测问题的特征。同时,预测的可预测性和准确性通常随着预测期的增加而降低。
2. 绝对误差指标
平均绝对误差(MAE)和平均绝对百分数误差(MAPE)旨在评估相对偏差,方差APE(VAPE)表示绝对误差的离散度。
MAPE
=
100
%
M
N
∑
j
=
1
M
∑
i
=
1
N
ω
A
i
j
∣
y
i
j
^
−
y
i
j
∣
y
i
j
,
V
A
P
E
=
100
%
×
Var
∣
Y
^
−
Y
∣
Y
,
\begin{array}{c} \text { MAPE }=\frac{100 \%}{M N} \sum_{j=1}^{M} \sum_{i=1}^{N} \frac{\omega_{A_ i}^{j}\left|\widehat{y_{i}^{j}}-y_{i}^{j}\right|}{y_{i}^{j}}, \\\\ V A P E=100 \% \times \operatorname{Var} \frac{|\widehat{Y}-Y|}{Y}, \end{array}
MAPE =MN100%∑j=1M∑i=1NyijωAij∣
∣yij
−yij∣
∣,VAPE=100%×VarY∣Y
−Y∣,
其中M是时间步长的数量,N是道路的数量,
y
i
j
^
\widehat{y_{i}^{j}}
yij
、
y
i
j
y_{i}^{j}
yij和
ω
A
i
j
\omega_{A_ i}^{j}
ωAij分别表示第i条道路段中第j个时间步的预测结果、实际值和权重,
y
i
j
^
\widehat{y_{i}^{j}}
yij
和
y
i
j
y_{i}^{j}
yij的矢量是
Y
^
\widehat{Y}
Y
和
Y
Y
Y。
3. 平方误差度量
与绝对误差度量不同,平方误差度量使用误差平方来避免绝对值的复杂计算,即均方误差(MSE)、均方根误差(RMSE)、归一化RMSE和
R
2
R^2
R2。
R
M
S
E
=
1
M
N
∑
j
=
1
M
∑
i
=
1
N
ω
S
i
j
(
y
i
j
^
−
y
i
j
)
2
,
R
2
=
1
−
∑
j
=
1
M
∑
i
=
1
N
(
y
i
j
^
−
y
i
j
)
2
∑
j
=
1
M
∑
i
=
1
N
(
Y
ˉ
−
y
i
j
)
2
,
\begin{aligned} R M S E &=\sqrt{\frac{1}{M N} \sum_{j=1}^{M} \sum_{i=1}^{N} \omega_{S_i}^{j}\left(\widehat{y_{i}^{j}}-y_{i}^{j}\right)^{2}}, \\\\ R^{2} &=1-\frac{\sum_{j=1}^{M} \sum_{i=1}^{N}\left(\widehat{y_{i}^{j}}-y_{i}^{j}\right)^{2}}{\sum_{j=1}^{M} \sum_{i=1}^{N}\left(\bar{Y}-y_{i}^{j}\right)^{2}}, \end{aligned}
RMSER2=MN1j=1∑Mi=1∑NωSij(yij
−yij)2,=1−∑j=1M∑i=1N(Yˉ−yij)2∑j=1M∑i=1N(yij
−yij)2,
其中,
ω
S
i
j
\omega_{S_i}^{j}
ωSij是RMSE中第i个路段第j个时间步长的权重,
Y
ˉ
\bar{Y}
Yˉ代表Y的平均值。较小的MAPE或RMSE意味着更好的预测精度,预测精度的平均值,
R
2
R^2
R2越大,预测效果越好。
4. 计算时间
根据深度学习方法的训练过程,计算时间可分为两部分:推理时间和训练时间。前者是指完成预测的计算时间。推断时间越长,在线预测的价值越低。此外,训练时间反映了预测模型的复杂性,而具有精确结果的轻模型是发展的趋势。此外,由于计算时间与硬件有关,因此比较相同硬件条件下的计算时间是有意义的。
(二)公共数据集
数据集对于预测模型的开发和评估至关重要。
*由于表格空间有限,对Reference列作了省略,深感抱歉
(三)开源模型
开源模型可以帮助研究人员快速理解现有模型的思想,并复制其方法进行比较。
Application | Model | Reference | Year | Framework | Link |
---|---|---|---|---|---|
Traffic | DCRNN | Li et al., 2018b | 2018 | TensorFlow | https://github.com/liyaguang/dcrnn |
GRNN | Wang et al., 2018 | 2018 | - | https://github.com/xxArbiter/grnn | |
STGCN | Yu et al., 2018 | 2018 | keras | https://github.com/Knowledge-PrecipitationTribe/STGCN-keras | |
Graph WaveNet | Wu et al., 2019 | 2019 | Torch | https://github.com/nnzhan/Graph-WaveNet | |
ST-MetaNet | Pan et al., 2019 | 2019 | MXNet | https://github.com/panzheyi/ST-MetaNet | |
T-GCN | Zhao et al., 2020b | 2020 | TensorFlow | https://github.com/lehaifeng/T-GCN | |
GMAN | Zheng et al., 2020 | 2020 | TensorFlow | https://github.com/zhengchuanpan/GMAN | |
Lane-level | MDL | Lu et al., 2020a | 2020 | - | https://github.com/lwqs93/MDL |
ST-AFN | Shen et al., 2021 | 2021 | - | https://github.com/MCyutou/ST-AFN |
八、现有挑战和未来方向
运输系统速度预测的现有挑战和未来研究机会,如图6所示。
(一)速度预测系统
1. 系统的速度预测
系统的速度预测旨在结合不同级别的速度预测,不同于单一级别的速度预计,以预测不同级别的车速。
- 系统速度预测可以增强ground truth的确定性部分,并借助不同级别的信息扩展应用程序,特别是对于智能车辆基础设施合作系统。系统速度预测的进一步应用仍然不足,值得鼓励。
- 其次,对交通的全面了解可以促进进一步的模型开发并推动它们向前发展。
- 此外,当前的系统探索可以作为未来交通参与者速度预测的基础**,例如自由人群流、两轮车辆等等。
2. 大规模交通数据
交通中的各种时空数据使得系统速度预测成为可能。然而,大规模数据给数据处理带来了巨大的挑战。因此,边缘计算(edge computing)被视为速度预测的未来框架。此外,隐私保护意味着计算效率的降低,必须考虑效率和隐私安全之间的权衡。
(二)信息基础
1. 各种信息
- 现有的研究大多将外部因素单独考虑,忽略了各种因素之间的耦合关系。因此,进一步提取复杂的交通模式变得非常重要。
- 在更大范围内提取时空相关性仍然是未来的一个方向。预测研究应从时间维度的短期扩展到长期,从空间维度的单一车辆、车道、路段扩展到路网。
- 除时空相关性外,还应考虑影响因素的更系统特征
2. 多种信息的融合
多源信息的互补性可以补偿缺失或有噪声的数据。就融合方法而言,特征级融合可以实现比数据级融合更好的性能。
- 多源数据的特点(如类型、分辨率)是不同的,不同数据的处理方法是信息融合的首要问题。
- 随着信息维数的增加,特征提取的难度和计算量将显著增加。因此,数据需求和计算效率之间的平衡是一个重要的方向。
(三)预测模型
1. 理解和解释模型
如今,速度预测的主流是深度学习,但它因其黑箱特性而受到批评。端到端的特点使我们能够在不了解如何获得结果的情况下获得准确的结果,这大大降低了此类方法的可靠性和可移植性。实际上,人们甚至可能更喜欢解释性更强但性能较差的解决方案。一个潜在的方向是将信息和知识的物理特征映射到深度学习网络或输入中。
2. 模型的稳健性
预测模型的鲁棒性通常指的是抵抗扰动和噪声的能力。在数据收集过程中,由于环境影响和传感器限制,数据不可避免地会丢失和产生噪音。大多数研究将数据处理(即缺失和噪声处理)与模型本身分开。此外,将数据插补与预测方法相结合是模型稳健性发展的未来方向。然而,在现实环境中,数据不完善是不可避免的,因此开发具有良好鲁棒性的预测模型需要更多的努力。
3. 模型的适应性
-
对道路网络不同结构的适应性
由于交叉口和红绿灯控制的复杂性,城市道路上的交通模式比高速公路更为复杂(Jin,2010),导致它们的交通模式不同。
-
对不同交通场景的适应性
罕见场景,如事故场景
-
对不同车辆的适应性
-
对交通模式变化的适应性
我们的城市一直在发展,道路的改造导致旧的交通数据无用,这被定义为概念漂移。
-
对新的交通数据的适应性
一些基于图的预测方法采用动态输入矩阵来建模动态时空相关性。有必要继续在这方面进行进一步的研究。
由于数据驱动方法不需要显式建模,速度预测模型也可以应用于其他预测,并促进预测方法的发展。
4. 新兴模型
如Transformers,Generative Adversarial Networks (GAN),Meta learning等为速度预测提供了新的活力。
5. 选择最佳模型
- 实际问题需要额外考虑,如硬件限制、实时性能、数据需求、准确性等,平衡这些需求以选择正确的模型,需要进一步研究;
- 现有的工作大多集中在新模型的设计上,但对模型参数优化的关注不够;
- 现有模型趋向于更复杂。大多数工作都是机械地堆叠时空层来提取时空相关性。
(四)标准评估系统
现有的方法有不同的实验数据集和评估指标,这使得很难说明性能改进是由于参数调整还是模型改进。因此,迫切需要一个基准评估系统,包括标准数据集、预测模型和合理的评估指标。
1. 基准数据集和预测模型
基准数据集可以使实验标准化,并比较同一领域中各个方法的性能。标准预测模型为基准评估勾勒了一个评估参考,并减少了比较实验的工作量。
2. 合理的标准指标
合理的评估体系对于识别模型问题和指导模型开发至关重要。然而,目前的评估主要侧重于准确性评估。事实上,应评估实际应用的各种性能。