基于图卷积门控循环网络参数估计优化的地铁客流预测模型

7a2f424127881fc8aa4ba792a82dddba.png

文章信息

dad43e097ee3ee1d7d60877a2080e053.png

论文题目为《TMFO-AGGRU: A Graph Convolutional Gated Recurrent Network for Metro Passenger Flow Forecasting》的一篇2023年发表在IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS的基于图卷积门控循环网络参数估计优化的地铁客流预测文章。

3e843a257363f3d89a8634ee177485cf.png

摘要

0edd554719e10871b0a49d8f7fbc62a2.png

准确挖掘与地铁网络相关的客流空间相关性,对于地铁客流预测具有重要意义。本文提出了一种基于图卷积门控循环神经网络参数估计优化的地铁客流预测模型:TMFO-AGGRU。首先,建立了一个图卷积门控循环神经网络模型,该网络能够对目标站点的客流进行实时时空信息训练。其次,设计了图卷积运算来取代门控循环神经网络的线性运算。为了充分利用基于不同流量特征的输出数据的加权分布,本文利用特征学习将相邻的静态矩阵转换为动态特征矩阵,并构建注意机制模块。最后,为了实现结构参数的动态优化,避免参数选择不当影响预测精度,本文提出了一种基于t方差(T-variance)的自适应蛾焰优化(Adaptive Moth-Flame Optimization)方法。实验结果表明,该方法有效地提高了预测精度和收敛速度,优于传统的地铁客流预测方法。

fba529cc33657ecd8ef6ec3fa40715f4.png

引言

182ff1dd227eff1da94d92fe314e8fd8.png

  • 研究意义与挑战

地铁客流预测的目标是预测未来交通站点的客流流入和流出。当前,随着城市化的发展,交通效率和车站安全都受到了挑战。合理的地铁调度和客流分布策略有助于提高地铁网络的运输效率和服务质量,受到地铁运营商的重视。准确、稳定的短期客流预测可以为列车调度和客流配置提供必要的基础数据。地铁客流预测已成为智能交通系统的一个重要研究领域,其重点是对未来某一时期的地铁客流进行预测。然而,准确、实时的地铁客流预测一直是一项具有挑战性的任务。由于波动和突发性情况的存在,客流时间序列是非线性的。另一方面,由于天气和土地利用的原因,地铁交通的波动和突变趋势难以预测,这阻碍了地铁交通时间变化模式的识别。需要注意的是,准确描述地铁站周边空间特征与客流特征之间的关系,准确捕捉地铁站的空间影响是一项具有挑战性的任务。

  • 研究贡献

针对上述问题,本文提出了一种结构优化的图卷积门控循环网络地铁客流预测方法。本文的主要贡献体现在:

(1) 提出了一种结构优化的图卷积门控循环神经网络地铁客流预测方法(TMFO-AGGRU)。通过构建能够同时训练与预测节点相关的三种交通流数据的深度信任网络模型,增强预测的时空相关性。

(2) 提出了一种交通图卷积GRU算法。该GRU基于不同的地铁客流特征,采用多输入深度捕捉地铁客流时空相关性。与现有的深度学习模型不同,门控循环神经网络中的线性操作被图卷积操作所取代。将图卷积网络中的邻接静态矩阵转化为基于特征学习的动态矩阵,并建立了对不同客流特征输出数据分配权重的机制。

(3) 为了优化预测精度,本文使用了一种t变自适应蛾焰算法,进一步优化预测模型的隐层结构。该算法可以根据实际模型进行动态调整,以提高方法的预测性能。

b35457e790f6a13a0a384428f63c11f7.png

客流预测模型

2242eb279c4ace772c24b8a86531f3ce.png

  • 整体框架

我城市地铁客流数据不仅与时间有关,还与多个相关站点之间的空间距离和土地利用性质有关。因此,客流数据在一定范围的相关空间内,站与站之间存在关联关系。这种空间联系有许多因素,而且相对微观,因此很难确定确切的变化模式。为了克服这一困难,我们提出了一种新的地铁网络客流预测模型,该模型将三个图卷积门控循环神经网络级联,同时处理多种类型的数据。将学习结果融合,识别地铁交通数据的时空特征,得出预测结果,如图1所示。

cab8c33a0de70d8d08b7d60b16964929.png

图1 模型架构示意图

  • 模型细节

(1) X(t−1)γ、X(t−1)ζ和X(t−1)λ分别表示学习得到的始发站和目的地站的地铁客流以及地铁网络中相邻站点的历史客流数据的时空变化。R(t)为更新门;Z(t)为重置门;GCN代替线性运算;σ为sigmoid激活函数;Ht−1是t-1时刻的隐藏状态;Xtγ,xtζ和xtλ是隐藏节点的输出;Ht是传递给下一个节点的隐藏状态。将地铁网络的拓扑结构看作是一个未加权的有向图,将每个地铁站视为一个节点,如下所示:

G=(V, E, A)

其中顶点V表示地铁站,E表示边集合,表示地铁站的关联关系,A是邻接矩阵,d36c8b3cc82278cf5a3a2b030644c81c.png用来表示节点的连通性。

(3) 由于GCN中的邻接矩阵是静态的,该模型对地铁客流网络的空间特征学习能力较差。为了动态学习地铁网络客流的空间特征,我们通过网络训练更新迭代关系矩阵来学习空间特征。然后,定义关系矩阵为:

b1a79978926e160bbe694f45f3d2c875.png

其中034570db920911f274819d1de473d569.png为两个站点之间的第m层关系,i为1c46148de858cc77ea03768d896835b3.png所在的层数,9a95c1675a2484fb3ed0cae181fcb798.png随着整个网络的训练迭代更新,其余层根据映射函数4aff035d68458f1c807945a02187facf.png进行更新。8c2a4b8ea3ae8f9e61c5bbe1e10694c1.png为m+1层的映射函数,f0827c99355e12e2af973db714add1eb.png为卷积参数,t为预测时间粒度数。T为模型预测数据的长度,b48c213e8a913be47383ab9c71505219.png为图卷积上第m层站点的特征。K是扩散网络的层数。

(4) 为了更好地提取地铁客流的空间依赖性,本文使用GRU深度学习框架来增强算法的空间信息处理能力。这样,通过用图卷积计算代替GRU中的线性运算,增强算法的空间信息处理能力,学习目标地铁站的客流、多个始发站和目的地地铁站的客流以及地铁网络中相邻车站的历史客流数据的时间变化。本文添加三个输入来学习上述三种类型的数据,其中每个输入从相应的地铁交通数据中学习输出。到目前为止,我们已经使用了注意机制来量化上述三类数据的权重,以便更客观地描述上述三类数据对客流的影响程度。因此可以实现多特征融合,图卷积门控循环网络模型(GGRU)的时空特征的学习和传递方程如式所示:

6635c3736ff1064797973df4876ae49d.png

5) 在本文中,图卷积门控递归神经网络的最终输出为并且使用向量的三个模型输出的结果作为注意机制模块的输入值:

098972ad69bf83255cb1ac9f9bb5e899.png

结构优化算法

323a14c3c47921d8463816a08e276c18.png

在图卷积门控递归神经网络地下客流预测模型中,不同隐层结构维数的选择会对模型的预测精度产生较大影响,导致相同框架下不同参数选择下模型的预测性能差异较大。为了进一步提高该模型的预测精度,本文提出了一种t变自适应蛾焰优化算法,该算法基于图卷积门控递归神经网络隐层结构的维数特征,对地铁客流预测模型的隐层结构维数进行优化,使其能够动态合理地选择最优隐层结构。

  • 一种t变自适应蛾焰优化算法

本文利用城市交通IC卡采集本研究所需的刷卡时间、刷卡站点等相关客流数据信息,并对这些客流数据进行分析和预处理。根据模型输入数据要求,将地铁网络中的客流数据分为以下三类:历史交通客流数据、邻近重要站点的历史客流数据、以预测站为起点和终点的历史客流数据。然后,对地铁客流进行预测。模型中的参数采用t变自适应蛾焰优化算法进行优化,以损失函数为最小目标,即预测值与实际值的均方根误差(RMSE)和平均绝对百分比误差(MAPE)之和,如下式所示:

96f5a0e43ffd6fa0c1c26f306a50e6f0.png

fd141810af31588e4c1e19d43477e6ce.png

步骤1:从地铁网络中采集样本乘客数据,主要包括实验地铁站点的历史流量数据、附近重要站点的历史乘客数据以及作为起点和终点的预测站点的历史数据。数据预处理主要通过数据清洗和数据整合来去除噪声和不相关数据。得到的地铁交通数据按5分钟汇总,以符合预测模型输入的数据格式

步骤2:构建具有3个输入层、1个中间层和1个注意机制输出层的图形化卷积门控递归神经网络,建立显层和隐层的结构及相关参数

步骤3:以历史n时间序列数据为输入,利用图卷积运算捕捉城市地铁网络结构,利用Eq.(2)- Eq.(9)进行地铁客流的空间信息传递,其中Eq.(6)- Eq.(9)中的网络迭代动态学习乘客的空间特征。

步骤4:将获得的具有空间特征的时间序列输入门控循环单元模型,利用式(10)-(13)传递信息,通过两个单元间的信息传递获取动态变化,捕捉时间特征。结果是通过一个全连接层得到的。

步骤5:将图卷积门控递归网络的输出构造为矩阵,作为注意机制的输入模块,用于量化三类数据对客流量影响的权重大小,并根据该权重分布预测客流量

步骤6:构造并优化图形卷积门控递归网络,建立t方差自适应蛾焰优化算法,初始化粒子的初始位置、初始速度、惯性权重和最大迭代次数。

步骤7:根据Eq.(18)进行t变分运算更新飞蛾状态,根据Eq.(19)和Eq.(18)- Eq.(23)自适应更新火焰位置,得到火焰位置和最优超参数的全局最优解。

步骤8:优化地铁客流预测模型结构,基于优化后的超参数,构建具有优化结构的最终门控单元卷积神经网络地铁客流预测模型

步骤9:测试集对训练好的短期交通流预测模型进行测试,根据测试结果对模型参数和指标进行微调,进一步提高预测效果

步骤10:将预测结果与实际值进行比较,验证预测精度是否达到预期目标。如果满足目标,则输出结果。如果不满足目标,则重复步骤2,重置模型结构参数指标,观察预测输出值的变化,直到精度满足标准。

65ebb3757c7070e559d5771a7ef8693c.png

实验

9f1441a12067cd00fbac75d5128e9c41.png

  • 研究范围

实验使用4月份上海地铁网络的客流量数据。上海有20条地铁线路,508个地铁站。本文以1号线、2号线、8号线的换乘站人民广场站为例。周边有换乘站和普通站。对数据进行分析和预处理,得到4月1日至4月30日期间的地铁客流和刷卡时间。样本每隔5分钟采集一次,包括人民广场站的历史交通数据、附近重要车站的历史交通数据以及作为起点和终点的人民广场站的历史交通数据。考虑到周末与工作日地铁客流特征不同,本文将工作日与周末分开进行预测。因此,选择4月份的周末和工作日作为训练样本集,并结合研究站的空间特征和周边土地的性质对相应的模型进行训练。选取4月26日(周末)和4月27日(工作日)作为验证集,对提出的预测模型进行验证。

  • 指标选择

为了更客观地评价地铁交通预测的准确性,本文选择了平均绝对误差(MAE)、均方根误差(RMSE)、相关系数R2、精度和平均绝对百分比误差(MAPE)。

0bf1f9ab9ed7c1d2185266f8ea9c62b1.png

式中,i为样本量,d57eaaf60e59e910d66e2aec3acd4cdc.png为时刻i的真值,d18de97f431452eeac20a6157df297f6.png为时刻i的预测值,9c8c6323281f94e21320811683a900c0.png为客流真值的平均值,N为预测数据的条数。

  • 结构优化门控递归神经网络对预测性能的影响

在为了更好地了解地铁客流的时空特征,动态优化预测模型的参数设置,本文提出了一种基于自适应蛾焰优化(TMFO)的图卷积门控循环网络预测模型结构动态优化方法(以下简称TMFO-AGGRU)。为了评估本文采用的t变蛾瓣优化算法、图卷积网络和注意机制对模型预测精度的影响,本实验采用TMFO-AGGRU模型,将不含结构动态优化算法(以下简称AGGRU)模型的图卷积门控循环网络预测模型与常规GRU模型进行对比,验证结构动态优化算法、图卷积运算和注意机制对预测精度的影响。图4为未进行动态优化的TMFO-AGGRU和AGGRU预测模型与经典GRU预测模型在工作日的预测结果对比。图5为未进行动态优化的TMFO-AGGRU和AGGRU预测模型与经典GRU预测模型在周末的预测结果对比。

1367cd6c98c9a665ac10877c8940b026.png

9b6d6d17a3ac1640489b3ed0a1015f82.png

由图4和图5可以看出,本文提出的结构优化图卷积-门控循环网地铁客流预测方法能够更好地学习客流时空特征,学习并传递客流特征变化规律,有利于提高预测精度。

  • t变蛾焰算法与经典优化算法的比较

为了获得本文模型的最优系数,在实验中选择隐藏单元的数量,并多次测试学习率以获得最优参数。具体参数选择及对比结果如图6所示。

cc2b37f0aa3e69911f0b024c787844e6.png

在本文中,设置了隐藏单元的个数和学习率的变化。通过训练,确定当隐藏单元个数为400时,得到最优结果,当学习率为0.02时,RMSE为最优结果。但为了减少两个参数之间的相互作用,我们采用不同的参数组合进行实验,如表2所示。根据表2实验得到的不同组合的预测性能如图6(c)所示。

945dd228cc4af1a860d1b4166912d49f.png

为了更准确地评估t变蛾焰算法(T-variant moth-flame algorithm, TMFO)对模型预测精度的影响,本文采用t变蛾焰算法与其他经典优化算法进行比较,并采用不同的模型预测精度,与采用萤火虫算法(FA)和蝙蝠算法(BA)优化的预测模型进行比较,不同工作日的指标对比如图7所示,不同周末期间的指标对比如图8所示。

27f680d2a5c3a281ae22c496b36ed4f5.png

dfe2f54fbd5654144bab1ff8c44d6077.png

从图7和图8可以看出,本文提出的优化算法在实际客流预测过程中可以有效提高预测精度

e6f3901a3aebe9c96813a6d595b7ac11.png

结论

52089def5451e61bc6e06d45544c9532.png

本文提出了一种考虑结构优化的图卷积门控循环网络。该方法的核心思想是综合考虑地铁客流时空变化、始末站客流以及相邻站历史客流数据对地铁客流预测的影响。根据地铁客流的空间关系,利用图卷积网络学习空间相关性,并将其集成到GRU的线性运算中,使模型能够同时学习地铁客流的时空相关性。采用基于t方差的自适应蛾焰优化算法对预测模型参数进行优化,使模型的预测精度略有提高。考虑了地铁客流时空变化、地铁站始末客流以及地铁网络中相邻车站历史客流数据对实验站的影响。通过构建能够同时训练与预测节点相关的三种交通流数据的深度信任网络模型,增强预测的时空相关性。采用实际地铁客流数据进行验证。结果表明,与经典深度学习预测模型相比,TMFO-AGGRU具有更高的预测精度和更短的运行时间。与不同时间粒度的预测结果相比,该模型的预测精度随着时间粒度的增加而降低,表明TMFO-AGGRU模型更适合于地铁客流的短期预测。本文提出的模型尚未用于重要节假日的情况,这可能导致节假日期间出行数量的突然增加,其准确性有所下降。

3af1cb986fb820a0d22a8237473ea45b.png

Attention

c8934557db0efd1d4c263fd73ad66b8c.png

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

  • 21
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
基于Matlab的贝叶斯网络优化卷积神经网络结合门控循环单元(CNN-GRU)用于预测的方法可以分为以下几个步骤: 1. 数据准备:收集和整理用于训练和测试的数据集。这个数据集应该包含输入样本和相应的标签。 2. 数据预处理:对数据进行标准化和处理,以确保所有的输入样本在相同的范围内。可以使用Matlab中提供的函数进行数据预处理。 3. 构建CNN-GRU模型:使用Matlab中的深度学习工具箱搭建一个CNN-GRU模型。这个模型可以由卷积层、池化层、GRU层和全连接层组成。可以根据具体的预测任务来确定模型的结构和超参数。 4. 模型训练:将数据集划分为训练集和验证集,使用训练集来训练模型,并使用验证集来调整模型的参数和结构,以提高模型的性能。可以使用Matlab中提供的深度学习工具箱中的训练函数进行模型训练。 5. 模型评估:使用测试集对训练好的模型进行评估。可以计算模型在测试集上的准确率、精确率、召回率等指标来评估模型的性能。 6. 模型优化:如果模型的性能不满足要求,可以尝试调整模型的结构和参数,重新训练模型,直到取得满意的结果。 7. 预测:使用训练好的模型对新的输入样本进行预测。将输入样本输入到CNN-GRU模型中,得到输出结果。 总之,基于Matlab的贝叶斯网络优化CNN-GRU模型能够结合卷积神经网络门控循环单元的优势,有效地进行预测任务。通过数据准备、数据预处理、模型构建、模型训练、模型评估、模型优化和预测等步骤的组合,可以得到一个性能良好的预测模型

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

当交通遇上机器学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值