基本信息
题目:Exploiting dynamic spatio-temporal graph convolutional neural networks for citywide traffic flows prediction
期刊:Neural Networks
时间:9.657 时间:2022
文章思路
城市拥挤流量的预测(The prediction of crowd flows)
挑战:复杂的时空依赖性与外部因素,如天气条件和地图注点(POI)分布
解决方法:
- 提出基于卷积神经网络和长短期记忆的统一动态深度时空神经网络模型(DHSTNet)
- 结合长短期记忆(LSTM)的图卷积网络(GCN)捕捉空间模式和短期时间特征形成GCN-DHSTNet模型(时空依赖性,不同时间粒度的影响)
3. 完全连接的神经网络被用来融合的时空特征和外部属性在一起
引言
流量定义:人群流量预测问题的目标是根据从时空模式中获得的历史数据实时预测未来的时间流量
影响因素:
在每个区域:空间依赖性:r2区域的流入受到远区和近区流出的影响(r1和r3);r2的流出可以影响附近区域的流入。此外,r2区的流入可能会影响其自身的流出。
时间依赖性:交通拥堵在连续时间内变化缓慢,呈现周期性变化规律。
创新点:
- 提出的DHSTNet模型动态地学习了城市范围内交通人群流数据的时空特征,同时预测交通网络上的每个区域的交通流量
- 考虑时空依赖性以及道路状况等其他外部因素
- 进一步使用DHSTNet设计了图卷积网络,称为GCN-DHSTNet(增强的GCN:动态交通流的空间依赖性,LSTM模型来捕获动态的时间相关性)
模型
DHSTNet模型:
AAtt-DHSTNet模型
GCN-DHSTNet模型
假设整个城市并将其划分为(a × b)维网格地图。
时间轴被分成三个不同的时间段,其用于表示:(i)遥远的,(ii)最近的,和(iii)近的历史。
- 从外部数据集中手动提取某些重要特征,馈送到两层全连接(FC)神经网络中
- 使用参数矩阵将三个部门的输出组合为XF,其中不同的权重应用于不同区域中的各种特征的效果
空间依赖性:给定的t时间间隔内,将城市划分为a × B个区域,人群流可以表示为一个张量Xt ∈ Ra×b×k,其中k表示交通流的变量个数.生成的张量可以是多通道的图像,其包括像素的宽度b、通道的像素k和像素的高度a。这种形式的图像捕获了该地区交通人群流量的空间依赖性
实验
数据集:
TaxiBJ:16个月的出租车轨迹数据是从北京市收集的四个不同的持续时间。最后四周的数据用作测试数据,其余的用作训练数据。
BikeNYC:包含大约4,392张流量地图,比例尺为16乘以8,时间间隔为1小时。行程长度、初始和最终站点ID以及初始和结束时间都包含在自行车信息中。数据集的最后十天用作测试数据集,其余用作训练数据集。
对比实验
交通流量的流入和流出结果:
整体对比
- GCN-DHSTNet-----DHSTNet:DHSTNet没有解决的先前输出和过拟合。
- CN-DHSTNet考虑不同类型的移动对象(例如出租车和自行车)之间的相关性,并且它可以学习复杂交通网络的更多时空方面,以提高预测精度
不同的GCN-DHSTNet变体
- GCN-DHSTNet:该方法结合了所有四个因素,即最近、每日、每周和外部属性。
- GCN-DHSTNet-C:所提出的方法只是捕捉最近的分支空间和时间的依赖性。
- GCN-DHSTNet-CD:所提出的方法仅包括两个特征,即最近和每日。·
- GCN-DHSTNet-CDR:该方法由三个时间属性组成,分别包括最近、每日和每周。
网络深度的影响
RMSE的值首先随着残差单元数的增加而减小
模型的可扩展性
使用三种不同类型的激活函数,即Softmax、Sigmoid和ReLU
了验证模型可扩展性的一致性,使用各种流量数据集和不同的参数评估所提出的技术
Q-traffic数据集与TaxiBJ相似,间隔时间为15分钟,而不是6分钟。
西安道路交通数据集:以2分钟时间间隔收集的。(该轨迹还双向交通,具有周末、拥堵和天气细节)。
由于西安道路交通数据集很大,并且考虑了双向交通,因此比Q交通数据集的变化更大,这意味着应根据数据集和道路条件的特点使用适当的激活函数