跨城车流量预测的探讨

随着经济发展,现代城市面临着越来越严重的交通问题,如交通堵塞、道路建设问题等。如果

能够精确的对车流量进行预测,那么就能对道路建设、交通疏导提供帮助。然而,由于国内城市发展水平不一致,基础建设进度也参差不齐。现有的交通流数据主要依靠车辆驾驶者的移动通讯设备在通信基站留下的信息进行收集,所以在发达的一线城市,例如北京、上海,交通运输部门可以借助其发达的移动通信网络捕捉到大量车辆移动信息。但是,一些城市受限于基础设施水平,只能在有限的范围内收集到部分数据。例如,在市中心通信设备完备密集的区域捕捉部分数据。在缺乏大量数据的情况下,交通流模型难以被训练到较高的精度,并且预测区域严格受限。同时,现有的交通流训练模型一般都是基于历史数据以离线方式进行训练,这种训练方式通过长时间的训练以提高交通数据信息提取以及分析能力,然而这种方式泛化性较差,例如,模型在训练完成后,很好地对北京交通数据进行分析,然而在面对和北京时空差异化较大的城市产生的交通数据时又需要重新开始训练。在实时产生的交通数据背景下,这样的训练方式使得模型的泛化性以及预测效率较低。

近年来现有的交通流预测模型大多基于离线方式进行集中式训练,如采用时空卷积神经网络或卷积神经网络等进行交通时空数据的时空关联性信息进行提取,为了解决跨城区的交通流预测问题,迁移学习被运用在交通流预测上,其原理是当一个训练好的模型在面对差异化较大的数据集时候利用参数微调或者域适应等方法对模型参数进行迁移提高模型的泛化性。然而,交通数据一般由不同的城市管理机构所掌握,大多数情况不进行对外共享,同时,区域内的交通数据可能被不同的交通服务提供商所掌握,无论从微观还是宏观角度上,提高交通数据安全性是十分有必要的,因此如何保证数据安全的前提下,进行跨城区的模型迁移是十分关键的。为了提高数据隐私性,一种分布式地联邦学习框架可以实现这一效果,具有数据孤岛特性的数据拥有者可以通过模型只负责训练自己的交通数据,然后通过共享模型的参数间接实现交通知识的共享,这一过程由于并没有涉及到原始数据的共享,因此可以更好地保证隐私。

本发明的目的是为了克服上述提到的目前研究缺点,提出了一种基于联邦学习的跨城区交通流预测(Federated Learning-based Across Cities for Mobile Traffic Prediction, Fed-ACMTP)算法,在该算法中,我们将源数据域训练完成的交通流预测模型迁移到目标数据域中,并通过域适应以及参数微调等方法对模型进行迁移学习,同时在目标数据域中利用联邦学习以保护交通数据的隐私。

算法预设如下:

步骤1:在源数据域中定义一个交通流预测模型,并进行多次训练以达到一定精确度;

步骤2:通过域适应或参数微调等方法进行参数的迁移学习以适应目标数据域的交通时空分布;

步骤3:在目标数据域中利用联邦学习对细粒度的区域进行模型训练;

步骤4:利用基于空间相似度的参数聚合方法进行联邦参数聚合;

步骤5:重复步骤3-4;

步骤6:得到目标数据域的预测结果;

首先,本发明在源数据域中定义一个交通流预测模型,该模型可以自定义也可以直接使用一些传统的交通流预测模型,如ConvLSTM,ST-ResNet或者时空卷积网络模型等。然后基于源数据对进行训练,训练完成后进行迁移学习。

本发明定义目标数据域中有个客户端,每个客户端负责小区域的交通流预测任务,因此定义交通流预测模型集合为. 假设的参数集合为,由于进行迁移学习之前需要进行域适应才能进行参数微调,因此模型的结构需要有所变化。首先考虑到目标域和源域的输入维度不一致,因此需要在模型前面增加若干层卷积神经网络层以对数据进行空间信息提取,最后为了保证输出与目标域相吻合,模型后面也需要增加若干层卷积神经网络层进行空间维度变换,假设前面以及后面增加的网络结构参数集合分别为和,则中的参数集合应为它们的并集,即。利用迁移学习保证了模型大部分参数不用重新训练,大大提高了训练的效率。

为了提高参数聚合时模型对时空信息的捕获能力,本发明设计了一种基于空间相似性的联邦参数聚合方法。该方法加强区域间交通信息联系,充分融合空间特性,可以利用相邻区域模型间参数的相似度来表示:

本发明提出的基于卷积神经网络模块的域适应算法可以有效地将源域与目标域空间维度不同的数据集进行匹配。

  1. 本发明提出一种基于空间相似度的联邦聚合算法,可以有效地在空间属性分布不均的情况下,提高空间依赖性,保护模型的数据隐私。
  2. 本发明提出基于联邦学习的目标域采用分布式交通流预测模型,可以提高模型的预测能力和机构的数据安全性。

域参数及距离相似度越高,则它们间的权重越大,则表明两区域间交通信息联系更紧密。其中和是控制邻接参数的尺度和稀疏性的两个因子。其中为模型的参数集合,为临近区域i的区域集合。下一次模型参数更新之前,需要采用上述公式对模型参数进行基于相似度的参数加权聚合。

图1为Fed-ACMTP算法流程图,从图中可以看出本发明创新点集中在参数迁移以及基于空间相似度的联邦参数聚合部分。通过多次的参数共享以及模型的训练,使得目标域模型在源域模型参数的基础上进一步挖掘城区空间相似度,提高模型的泛化性以及可复用性。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值