多服务模式的网约车需求预测

1. 文章信息

文章题为《Joint predictions of multi-modal ride-hailing demands: A deep multi-task multi-graph learning-based approach》,该文发表在Transportation Research Part:C,其内容主要关注网约车的不同模式,以及不同模式的需求预测。

2. 摘要

网约车平台通常为客户提供各种服务选项,如单人乘车服务(solo ride service)、共享乘车服务(shared ride service)等。通常而言,不同服务模式的需求是相互关联的,一种服务模式的需求预测可能受其他服务模式的历史需求值影响。此外,对多种服务模式的需求进行准确的联合预测可以帮助平台更好地分配和调度车辆资源。尽管有大量研究针对一种特定服务模式的网约车需求进行预测,但对于多种服务模式的叫车服务需求的联合预测却鲜有研究。为了解决这个问题,文章从提出了一种深度多任务多图学习方法,该方法包括两个部分:(1)用于预测不同服务模式需求的多图卷积(MGC)网络,以及(2)支持跨多个MGC网络共享知识的多任务学习模块。更具体地说,建立了两个多任务学习结构。第一种是正则化跨任务学习(RCT),它在多个MGC网络的输入和输出之间建立跨任务连接。第二种是多元线性关系学习(MLR),它对各种MGC网络的权重施加先验张量正态分布。虽然不同的MGC网络之间没有具体的连接,但这些网络的权重相互约束,服从共同的先验分布。文章通过对曼哈顿出租汽车数据集的评估,结果表明,对于不同的网约车模式,文章提出的方法在预测精度方面优于基准算法。文章的创新点总结如下:

  1. 文章提出一种新的多任务多图学习方法,以实现多模式叫车需求以及其他时空联合预测任务的联合预测

  2. 提出两种多任务学习方法,即RCT和MLR,用于在MGC网络中共享不同预测任务的知识

  3. 文章在曼哈顿的实际叫车数据集上进行了广泛的实验,该数据集包含单独和共享的乘车服务。结果表明该方法优于现有的算法,并且使用多任务学习结构可以提高不同时空预测任务的预测精度。

3. 模型框架

在提及模型前,首先对符号进行阐述。假设平台共提供M种叫车服务模式。设表示在时间间隔t内,区域i中服务模式m的乘客请求数(乘客需求),表示所有区域在时间间隔t内对服务模式m的乘客需求。

空间相关性以及多图

首先,文章提出三类图,这三类图与服务模式无关。邻接图(neighborhood graph):图中元素定义如下,若区域i和j相连,其值为1;否则为0。

853dea5f5355ec53ec91587f969f2fe8.png

距离图(distance graph):图中元素定义如下,表示区域i和区域j之间欧氏距离的倒数。

535519b7f55b281101c299693877e9dd.png

功能相关性图(functionality graph):图中元素定义如下,其中表示区域i和j的功能向量,该向量包括没有私家车的家庭数量、房屋密度、人口密度、就业密度、每平方公里路网长度、到地铁站的平均距离等。

ab76597a680269a58b12df161fdc9e1f.png

出行规律图(mobility pattern graph):对于交通模式m,表示该种交通模式的出行规律图。图中元素定义如下,其中c698733e38a377f48d47bff489e7b02f.png分别表示区域i和j第m种交通模式的历史客流数据。

bedd519a1eba196c4a94aa7d3ed77cd1.png

多图卷积

基于多图,文章提出了多图卷积(MGC)。对于服务模式m,其多图卷积定义如下:

e0b596178ac0346d39e2c98e32b7bfb4.png

其中,5b58313242c7c1b13766a960a27f4880.png表示可训练的权重矩阵,8d748f4d82b7d01f6f2a30474720fa3e.png为输入特征,分别表示fi和fo输入输出特征的维度,30ec2dddba6259859be509e2efbb6bff.png为激活函数,bm为截距,16b2cd0a6bc02447578dfbba97129422.png为训练前给定的矩阵,其计算方法如下:

8f847f3adacd2874b1cd86a0d7e2a919.png

其中,276afa9f3c76fb01683c8ac8ba8013f8.png是度矩阵。

可以发现,多图卷积给不同的图分配了不同的权重,并将不同图的输出结果进行求和,从而获取最终输出。因此,在一个单图卷积中,文章将所有可训练权重(对于不同的图)视为一个权重矩阵。

正规化跨任务学习(Regularized cross-task learning, RCT)

文章提出了一种新的RCT学习结构,使不同服务模式之间能够相互共享知识。为方便理解,下图展示了RCT的基本结构,建立了两个基本的三层网络来预测两种服务模式的网约车需求。其中,蓝色表示单独服务,红色模式表示共享服务。

3906cda63fd38c2cd0ce7947cd74cb61.png

令表示第l层中,与从服务模式m到服务模式n的图卷积操作相关联的可训练权重矩阵(包含上述所有图的可训练权重)。在RCT学习框架中,文章针对不同的服务模式设计一个跨任务的网络结构,第l层中服务模式m的网络输出如下所示。

18a9c725cec308cadab889f74a78068d.png

对于服务模式k,卷积算子1bcad0051de2a5c8763a96979951ef85.png将第l层的输入映射为第l+1层的输出,并且由参数化。其中表示任务内权重,表示任务间权重。通过RCT学习框架,服务模式m的预测任务不仅可以利用来自其自身特征的信息,还可以利用来自其他服务模式的特征的信息。然而,RCT学习框架可能会极大地增加权重的数量,尤其是当存在许多服务模式时。因此文章通过引入以下正则化项惩罚目标函数中的权重。其中,e968d9a581bd633991c3d4470db8a697.png是一个预先设定比1小的的参数。

ecc06fa254713fffdb20642063e7033c.png

令分别表示服务模式m的预测需求的训练特征和标签,其中Nm是训练数据集中要预测的时间步总数。因此,在RCT学习框架中,可以通过解决以下问题来训练网络参数:

57ca0dd1928abde534c81c24ba435c56.png

多元线性关系学习(Multi-linear relationship learning)

该模型使用另一种权重从而实现不同任务的信息共享,如下图所示。与RCT不同,该模型没有为为不同的服务模式在网络的输入和输出之间建立交叉连接,而是应用了一个MLR学习模块该模块对多个网络的内部权重施加了先验正态分布。表明不同网络的内部权重相互约束,并服从共同的先验概率分布。

55169e5aa3c92f474d0a9acb42ade3eb.png

首先将l层中所有网络的权重放在一个张量中,如下所示。

274e7c1c4d1dd44c5f7e7ff8b2b24aa4.png

e0f58cfeb15c42c928c417937b2cedf9.png分别代表所有服务模式的完整训练数据,给定X、Y,其上述张量的MAP估计如下:

b37408df3f9546ed3bca712a80a82cd6.png

进一步,文章假设联合权重张量服从张量正态分布。

b942a32bf22ec5306d14d2fb15703ca2.png

其中,协方差矩阵可能会存在极大的维度,导致计算困难。为解决这一问题,文章将协方差矩阵分解为三个小协方差矩阵的Kronecker积,如下所示。

f34774058271433b635e71dae3a5523f.png

其中,等式右端的三项分别表示输入的协方差矩阵、输出的协方差矩阵和服务模式的协方差矩阵。由此可以推导出以下正则化优化问题:

644d5b17480f4fcb49f48192a37816a7.png

此外,对于协方差矩阵,文章采用flip-flop算法进行更新。对于输入的协方差矩阵以及输出的协方差矩阵,可以通过设置为单位矩阵并且不进行更新,从而提升训练的稳定性。在这种条件下,模型只关注不同服务模式之间的信息共享。进一步,可以发现RCT和MLR两个模型的正则项是层可分离的。因此,可以设计一个跨任务共享知识的多层网络,在某些层使用RCT学习,在其他层使用MLR学习。基于此,可以建立一个灵活的网络,如下所示。

cef1a6bd607682d50eec0cd44a13b4b6.png

4. 实验

文章针对曼哈顿区域的网约车数据,提取了单人乘车服务和共享乘车服务的小时需求数据,如下图所示,并基于此开展实验。

1f1c576237e345c2db1b8adce21ea26f.png

文章选择了237号区域(红色区域)的多图进行可视化,如下图所示。图a中突出显示了所有相邻区域;区域的颜色越深,该区域与目标区域之间的关系就越强。距离图如图b所示,其中靠近237号的区域具有更高的值。图c展示了功能图,图d展示了共享服务需求的空间相关性。

0645363930e270416b125b8a5bb326e1.png

实验结果如下所示。值得注意的是RCT-MGC表示只使用RCT学习框架的多图卷积模型,MLR-MGC表示只使用MLR学习框架的多图卷积模型,而MIX-MGC表示第一层使用RCT,第二层使用MLR的多图卷积模型。

cbf483e25a4d01babefe27a689547a98.png

a06052a595b92a25861a9d8b75428996.png

5. 结论

本文研究了招呼车系统中多种服务模式下乘客需求的联合预测问题。为实现不同时空预测任务之间的有效知识共享,文章提出一种新的深度多任务多图学习方法,该方法首先为不同的服务模式建立单独的MGC网络,然后使用RCT和MLR学习技术将网络连接起来。当RCT学习在不同的MGC网络之间建立起具体的桥梁时,MLR学习通过假设各种MGC网络的参数遵循共同的先验概率分布,在它们之间建立了软连接。通过对曼哈顿真实的打车数据集进行评估,结果表明,文章所提出的模型明显优于基准算法。此外,使用基于MGC网络的多任务学习技术可以进一步提高多服务模式时空预测任务的预测精度。这项研究开辟了一些值得探索的途径,(1)对不同交通方式(如自行车、私家车和公共交通)的乘客需求进行联合预测;(2) 在多区域层面上联合预测乘客对叫车服务的需求。

Attention

欢迎关注公众号《当交通遇上机器学习》。如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

当交通遇上机器学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值