文章信息
本周阅读的论文是题目为《Forecasting the subway passenger flow under event occurrences with multivariate disturbances》的一篇2021年发表在《Expert Systems With Applications》涉及突发事件下地铁客流预测的文章。
摘要
地铁客流预测在交通规划和运营中具有重要意义。演唱会、体育比赛等特殊活动带动了大规模的客流,很少有周期性的趋势。因此,预测突发事件期间的地铁出站客流是一项具有挑战性的任务。近年来,社交媒体已被用于社会经济预测。相关性分析表明,社交媒体流量趋势可以用于突发事件发生下的客流预测。本文在传统ID卡数据的基础上,将社交媒体数据融入客流预测。提出了基于多元干扰的混合深度神经网络(MDB-HDNN),该网络训练了来自附近站点的进站客流干扰和社交媒体发布趋势,用于事件期间的地铁客流预测。在三个真实数据集上的实验结果表明,MDB-HDNN在各种设置下表现良好,具有较好的鲁棒性。研究结果可为列车时刻表制定和客流引导提供决策支持。
介绍
精确的交通客流预测可以帮助城市交通管理者更好的规划、管理与运营。一方面,以往研究大多针对正常时段下的客流预测;对于突发事件,由于其无规律性,使客流预测成为一项具有挑战性的工作。另一方面,以往研究主要利用历史客流数据和时空特征对客流进行预测,社交媒体数据蕴含大量用户信息却几乎没有被用于客流预测的补充。
总的来说,目前的研究主要存在以下两个方面的局限,首先是大部分的深度学习模型在常规短时客流预测上有客观的表现,但忽略了社交媒体数据的影响,并且在特殊事件的预测上效果不好;其次,大多考虑社交媒体的研究主要集中于挖掘文本内容和客流之间的关系,时空方面的影响(例如所有站点的进站客流)并没有完全考虑,而从其他站点流入的客流被证实对观测站点的客流是有影响的,应该被重视,进行相应研究。
为了解决上述提到的局限,文章提出了基于多元干扰的混合深度神经网络模型(MDB-HDNNs),通过三阶段的模型框架,揭示周围车站进站客流、社交媒体数据对观测站点的出站客流影响。最后在三个真实数据集(北京东四十条地铁站、北京团结湖地铁站、北京奥利匹克公园站)上评估模型的预测性能,结果表明文章提出的模型效果优于现有的模型。
模型
文章提出了一种多干扰因素的混合深度神经网络模型(MDB-HDNN),充分考虑到突发事件下周围站点进站客流以及社交媒体数据对研究站点出站客流的影响,结合历史客流数据对t时刻目标站点的出站客流进行预测。具体算法原理如下图所示:
图1 模型总体框架图
如图所示,模型是一个典型的三阶段模型,各个阶段实现功能如下:
Stage1: Disturbance from inbound Flows of Other stations
在该阶段,文章首先构建了一个特征矩阵量化周围车站的进站客流,接着提出一个基于空间注意力模型的二维卷积神经网络以便捕捉其他车站进站客流的特征。
Stage2: Disturbance from Social Media
在阶段二,文章从微博数据中提取社交媒体的特征向量,采用基于堆叠自动编码器的神经网络(SAE-DNNs)训练模型,使模型可以准确提取社交媒体数据反映出的客流趋势,从而提高客流预测精度。
Stage3: Prediction
在这个阶段,作者首先从历史客流数据中消除来自其他车站进站客流和社交媒体数据的干扰;接着将无扰动的客流数据输入深度神经网络进行训练,学习固有的客流特征;最后将深度神经网络的输出与预测时刻的扰动相结合,获得最终的客流预测结果。
研究方法
1. Preliminaries
这部分内容首先介绍了文章方法论的初步内容,包括数据集描述、社交媒体数据与客流数据相关性分析以及问题陈述。
1)Data description
地铁ID卡数据集包括:进站名称、进站时间、出站名称、出站时间、ID卡编号以及ID卡类型。对ID卡数据进行预处理,经过统计,令表示第t个时间间隔下,目标车站观测得到的客流量。令表示地铁线网,其中表示地铁线网站点的集合,N是站点的数量。表示由车站到车站的OD路径。
值得注意的是文章把客流数据(时间序列数据)分解为三个部分:季节性、趋势以及噪声。假定观测的交通流为X,则存在,其中S,T和N分别表示客流数据的季节性、趋势以及噪声。具体来说,利用时间信息的预测方法可以捕捉到S,但不足以解释T和N的规律,这也会导致预测效果不佳。文章认为周围站点进站客流的突然增加以及从社交媒体数据收集到的用户参加某个活动的意愿可以解释T和N。
2)Correlation analysis
为了验证社交媒体数据真的可以在相关事件下的客流预测中起作用,文章对地铁客流数据和社交媒体数据的相关性进行分析。其中社交媒体数据的时空信息样本如下表所示:
表1 社交媒体数据时空信息样本
从表1可以初步推断,与举办赛事地理位置标签相一致的微博数量会增加,而与赛事举办位置不一致的地理标签的微博数量则会减少。紧接着,文章分别分析了在不同时间段下的客流数据与社交媒体数据的相关性以及不同场地和不同活动类型下的地铁客流数据与社交媒体数据的相关性,具体结果如下表所示:
表2 客流数据与社交媒体数据相关性分析
通过表格可以发现,所有相关系数均在0.45以上且显著,因此有理由相信突发事件客流与社交媒体数据存在一定程度的正相关性。
3)Problem statement
在t-1时刻,给定所有地铁卡交易和事件信息,包括历史客流向量,社交媒体向量以及矩阵,表示其他车站突然增加的进站客流,用于预测下一时刻目标站点的出站客流。
2. Disturbance from inbound flows of other stations
1)Spatial-temporal feature extraction
为了提高出站客流预测的准确性,文章提出了一种基于目标站点构建的时空特征图。为了预测目标站点t时刻的出站客流,定义t时刻目标站点的客流特征矩阵如下:
矩阵中每个元素表示t-1到t时刻之间,站点i的进站客流量;p表示地铁线网中的站点数量,q表示历史进站客流最大的观测时间窗。由于该矩阵只能捕捉其他车站每个时刻的进站客流,不能正确反映突发事件下和常规时间的不同,因此文章还构建了目标站点平均客流特征矩阵,表示常规下的客流特征,具体如下:
矩阵中每个元素表示没有事件发生时,车站i在t时间段内的平均进站客流。最终进站客流强度可以被定义为:
矩阵中每个元素表示与常规事件相比,每个车站的进站客流强度,如果取值远高于1,则该站的进站客流量显著增加的原因很可能是由事件所引起,而增加客流量有很大的潜力成为目标站点的出站流量。为了利用机器学习模型训练矩阵,文章将时空特征矩阵转化为特征图,具体流程如下图所示:
图2 客流数据时空特征图的生成示意图
2)Spatial attention module based model
考虑到阶段一的特征图的稀疏性(大多数值接近1),我们提出基于空间注意力机制的特征细化模型,如下图所示。
图3 空间注意力模块
空间注意力模块的计算过程主要为:以特征图作为输入,为了获得空间注意力,文章首先沿着通道轴使用平均池化和最大池化,并将它们合并以获得有效的特征描述。接着以其作为输入,经过一个卷积层获得空间注意力图。总的来说,空间注意力可以由以下公式计算得到:
式中,表示sigmoid函数,表示卷积操作,其中卷积核大小为7*7.
由于时空特征图是一个二维图,因此我们使用卷积层增加特征图的通道,然后使用空间注意力模块对特征进行细化,最后使用另一个卷积层减少特征图的通道数,如下图所示,表示特征细化后的特征图,作为输入放入CNN中,最后得到阶段一的输出。
图4 特征图细化流程
3.Disturbance from social media
1)Social media feature extraction
社交媒体为获取交通相关数据提供了一种经济有效的方法,并且填补了短时客流预测和社交媒体数据间的空缺。为了预测t时刻的客流,文章定义了社交媒体特征向量如下:
式中,每个元素表示时间段t中该事件相关话题标签的社交媒体量,m表示先前社交媒体推文的最大观测时间窗。文章的社交媒体数据主要从两个方式获取:第一种主要通过地理位置进行筛选,选出带有相应地理坐标的社交媒体推文;第二种则是收集与事件相关标签的社交媒体推文,通过社交媒体平台的生成的标签,可以获得与事件相关的帖子。具体提取算法如下所示:
2)Stacked autoencoder(SAE)-Based model
在阶段二,社交媒体特征向量被用于深层神经网络的输入,最后得到阶段二的输出。具体算法如下:
G表示基于堆叠式自编码器的深度神经网络(SAE-DNN)算法。自动编码器可以通过堆叠形成一个深度网络,通过渐进的特征提取获得输入的抽象表示。
4.Prediction
1)Historical flow
为了预测t时刻的客流,文章提出了使用相同类型事件下时刻t的历史平均客流作为输入之一。另外,文章还提出表示距事件发生的时间段i = t0 - t,其中t0表示事件开始的时间,t表示当前时刻。基于以上的定义,从历史数据中提取三种类型特征,则历史特征向量定义如下:
2) Predicted model
利用阶段1和阶段2的输出以及历史客流向量来预测阶段3目标站点的出站流量。由于客流既包括常规模型的客流,也包括不规则的扰动,因此在客流预测建模时需要对扰动进行处理。
为了解决这个问题,在阶段3,文章将阶段1和阶段2的输出与历史客流相结合,探索固有的客流模式和扰动之间的多重依赖性,以预测目标车站的出站客流。首先,消除历史客流数据的干扰,算法如下:
前者表示其他车站的进站客流以及从社交媒体数据抽取得到的参加事件的意愿的扰动;后者表示没有扰动下的历史客流特征向量。接着,输入无扰动的历史客流特征向量到预测模型以捕捉潜在的客流模式:
其中,H表示基础的深度神经网络算法(DNNs),由于客流数据已经清除了扰动,所以基础的DNNs就足够捕捉到潜在的客流特征用于预测。最后,文章将DNNs网络的输出与t时刻扰动相结合,得到预测结果:
5. Parameter learning
整个MDB-HDNN模型是为了解决一个优化问题,此处采用预测结果的均方误差(MSE)作为问题的目标函数:
θ表示整个模型框架的学习参数,采用Adam优化算法通过反向传播进行学习优化。
实验
文章利用三个真实的地铁数据集验证MDB-HDNN模型预测的准确性:分别是北京地铁2号线东四十条站(DSST),地铁10号线团结湖站(TJH)以及地铁8号线奥林匹克公园站(OPS)。具体实验结果分析可以仔细翻阅原文浏览,此处不加以描述。
总结
文章提出了MDB-HDNN框架用于模拟其他站点进站客流和社交媒体的影响,以确定内在的客流模式和多变量干扰,用于事件期间目标站点的出站客流预测。经过实际数据集验证,该模型在音乐会和体育赛事中表现良好,至于能否用于预测景区附近站点和大型聚集地点的交通客流还没有得到验证。在未来工作中,关于使用社交媒体的情感分析进行客流预测将是一个可行的研究方向。另外有关于赛事规模的相关指标,包括门票销售数量、场地座位容量都是影响客流大小的潜在因素,将文章提出的模型与事件信息分析相结合,对提高预测的精度具有重要意义。
ATTENTION
如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!