基于ResNet深度时空残差网络的城市交通流预测

1、文章信息

《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》。

2017年AAAI大会的一篇会议论文,作者微软研究院的张俊波,会后文章发在爱斯维尔旗下期刊Artificial Intelligence(IF:3.034),目前被引257次。

2、摘要

本文提出了一种基于深度学习的方法,称为时空残差网络ST-ResNet,来同时预测城市中每个区域的流入和流出客流量。更具体地说,我们使用残差神经网络框架来对拥堵流的时间临近性、周期和趋势特性建模(closeness, period, trend,暂且这样翻译吧)。针对每个属性,我们设计了三个残差网络分支,每个残差网络分支对拥堵流的空间特性进行分别建模,ST-ResNet动态整合三个残差网络分支的输出,为不同的分支和区域分配不同的权重。然后将整合结果进一步结合外部因素(external),如天气和一周中的哪一天,来预测每个地区最终流量。北京和纽约市(NYC)的实验表明,提出的ST-ResNet优于六种著名的方法。

3、简介

简介部分用了北京和纽约的两个拥堵踩踏案例引出,第一次见。然后强调介绍了本文同时预测inflow和outflow。同时预测流入流和流出流由于以下因素的影响极具挑战性:

空间依赖性spatial dependency:邻近区域的流入流和流出流相互影响。

时间依赖性temporal dependency:临近时刻的影响,前一天,上一周,季节性等周期特性。

外部因素的影响external factors:天气和突发事件等。 

 

本文的四点主要内容:

1、ST-ResNet采用基于卷积的残差网络对城市中任意两个区域之间的远近空间依赖关系进行建模,同时保证模型的预测精度不受神经网络深度结构的影响。

2、我们将人群流动的时间特性归纳为三类,即时间邻近性、周期性和趋势性。ST-ResNet使用三个残差网络分支分别对这些特性进行建模。

3、ST-ResNet动态地聚合上述三个网络的输出,为不同的分支和区域分配不同的权重。这种聚集进一步与外部因素(如天气)相结合。

4、我们使用北京出租车的轨迹和气象数据,以及纽约自行车的轨迹数据来评估我们的方法。

4、模型介绍

在本研究中,我们根据经纬度将一个城市划分为I×J网格地图,其中网格表示一个区域,如图2(a)所示。设P为第t个时间区间的轨迹集合。网格(i,j)位于第i行和第j列。和既有研究类似,也是将流入流和流出流叠在一起看成一个2×I×J的张量(2个channel,每个channel为I行J列)

网络结构示意图

该网络结构主要由4部分组成,分别提取时间邻近性、周期性、趋势性以及外部因素的影响。

上图右上角,首先将一个城市在每个时间间隔内的流入流和流出流分别转化为一个2通道的类图矩阵,然后我们将时间轴划分为三个片段,表示最近的时间、稍远的时间和遥远的时间(其实文章中这块就是考虑了邻近时间段,前一天相同时间段,上一周相同时间段)。每一个片段分别被输入到三个ResNet分支中用来提取提取时间邻近性、周期性、趋势性。前三个部分与卷积神经网络共享相同的网络结构,然后是残差单元序列。这种结构捕捉了附近和远处区域之间的空间依赖关系。在外部因素的处理上,我们手动从外部数据集中提取一些特征,例如天气条件和事件,并将它们输入一个两层全连接的神经网络。前三部分的输出与外部因素的输出进行融合,然后利用tanh激活函数映射到(-1,1)区间内作为输出。

前三部分的网络结构:

外部因素:

交通流量可以受到许多复杂的外部因素的影响,如天气和事件。图5(a)显示节假日(中国春节)的人流与平时的人流有很大的不同。图5(b)显示,与后一周的同一天相比,暴雨使得办公区域的人流急剧减少。

设Et为表示这些外部因素在预测时间区间t的特征向量。在本文中,我们主要考虑天气、假日事件和元数据(即工作日、工作日/周末)。为了预测t时段的流量,可以直接获取假日事件和元数据。然而,未来时间间隔t的天气是未知的,可以使用时间间隔t的天气预报或时间间隔t - 1的近似天气预报。在形式上,我们将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层。第二层用于将上一层的输出映射成与Xt相同形状便于融合。

融合:

对于前三部分的融合,由于不同区域都受时间邻近性、周期性、趋势性的影响,但影响程度可能不同。在此基础上,提出了一种基于参数矩阵的融合方法:

对于前三部分和外部因素的融合,直接相加再激活:

损失函数:MSE。

5、模型超参数

在ST-ResNet的输出中,使用tanh作为最后的激活函数,其范围在-1到1之间。使用Min-Max归一化方法将数据缩放到[- 1;1]。在评估中,我们将预测值重新缩放到正常值,并与ground truth进行比较。对于外部因素,我们使用one hot编码来转换元数据(即, Day Of Week, Weekend/Weekday),节假日和天气条件为二元向量,利用Min-Max归一化将温度和风速等缩放为[0;1]。

使用Python中的 Theano和Keras构建模型。Conv1和所有剩余单元使用64个尺寸为3×3的滤波器,Conv2使用2个尺寸为3×3的滤波器进行卷积。批次大小为32。90%的训练集,剩下的10%作为验证集。在固定数量的epoch(例如10,100个epoch)的完整训练数据上训练模型。考虑前一天和上一周的数据。评价指标RMSE。

6、实验部分

本文采用了两个案例,北京的出租车轨迹数据和纽约的共享单车轨迹数据,数据量和数据范围都很大,实验部分比较复杂,没什么特别大的借鉴意义,不再赘述。

7、思考

该篇论文也用到了前面共享过的纽约公开的共享单车轨迹数据集。

此外,该类复杂结构模型的一个鸡肋点是如何选择基准进行比较,输入因素这么多,其他基准模型输入是什么,模型配置是什么样的,这在既有文献中大多是直接给出结果,过程基本是一个黑箱子,目前也没有统一的解决办法。

Attention

如果你和我一样是轨道交通、交通运输、城市规划相关领域的,也愿意分享自己的科研生活,请加微信:Dr_JinleiZhang,备注“进群”,我会拉你进交通大数据分享群!希望我们共同进步!

Transportation-ML

与你分享科研成长的乐趣

长按二维码关注

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

当交通遇上机器学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值