跨城车流量预测的探讨

sirist

已于 2023-11-29 11:57:27 修改

阅读量996

点赞数 17

文章标签：人工智能

于 2023-11-29 11:51:16 首次发布

本文链接：https://blog.csdn.net/weixin_37606989/article/details/134686406

版权

随着经济发展，现代城市面临着越来越严重的交通问题，如交通堵塞、道路建设问题等。如果

能够精确的对车流量进行预测，那么就能对道路建设、交通疏导提供帮助。然而，由于国内城市发展水平不一致，基础建设进度也参差不齐。现有的交通流数据主要依靠车辆驾驶者的移动通讯设备在通信基站留下的信息进行收集，所以在发达的一线城市，例如北京、上海，交通运输部门可以借助其发达的移动通信网络捕捉到大量车辆移动信息。但是，一些城市受限于基础设施水平，只能在有限的范围内收集到部分数据。例如，在市中心通信设备完备密集的区域捕捉部分数据。在缺乏大量数据的情况下，交通流模型难以被训练到较高的精度，并且预测区域严格受限。同时，现有的交通流训练模型一般都是基于历史数据以离线方式进行训练，这种训练方式通过长时间的训练以提高交通数据信息提取以及分析能力，然而这种方式泛化性较差，例如，模型在训练完成后，很好地对北京交通数据进行分析，然而在面对和北京时空差异化较大的城市产生的交通数据时又需要重新开始训练。在实时产生的交通数据背景下，这样的训练方式使得模型的泛化性以及预测效率较低。

近年来现有的交通流预测模型大多基于离线方式进行集中式训练，如采用时空卷积神经网络或卷积神经网络等进行交通时空数据的时空关联性信息进行提取，为了解决跨城区的交通流预测问题，迁移学习被运用在交通流预测上，其原理是当一个训练好的模型在面对差异化较大的数据集时候利用参数微调或者域适应等方法对模型参数进行迁移提高模型的泛化性。然而，交通数据一般由不同的城市管理机构所掌握，大多数情况不进行对外共享，同时，区域内的交通数据可能被不同的交通服务提供商所掌握，无论从微观还是宏观角度上，提高交通数据安全性是十分有必要的，因此如何保证数据安全的前提下，进行跨城区的模型迁移是十分关键的。为了提高数据隐私性，一种分布式地联邦学习框架可以实现这一效果，具有数据孤岛特性的数据拥有者可以通过模型只负责训练自己的交通数据，然后通过共享模型的参数间接实现交通知识的共享，这一过程由于并没有涉及到原始数据的共享，因此可以更好地保证隐私。

本发明的目的是为了克服上述提到的目前研究缺点，提出了一种基于联邦学习的跨城区交通流预测（Federated Learning-based Across Cities for Mobile Traffic Prediction, Fed-ACMTP）算法，在该算法中，我们将源数据域训练完成的交通流预测模型迁移到目标数据域中，并通过域适应以及参数微调等方法对模型进行迁移学习，同时在目标数据域中利用联邦学习以保护交通数据的隐私。

算法预设如下：

步骤1：在源数据域中定义一个交通流预测模型，并进行多次训练以达到一定精确度；

步骤2：通过域适应或参数微调等方法进行参数的迁移学习以适应目标数据域的交通时空分布；

步骤3：在目标数据域中利用联邦学习对细粒度的区域进行模型训练；

步骤4：利用基于空间相似度的参数聚合方法进行联邦参数聚合；

步骤5：重复步骤3-4；

步骤6：得到目标数据域的预测结果；

首先，本发明在源数据域中定义一个交通流预测模型，该模型可以自定义也可以直接使用一些传统的交通流预测模型，如ConvLSTM，ST-ResNet或者时空卷积网络模型等。然后基于源数据对进行训练，训练完成后进行迁移学习。

本发明定义目标数据域中有个客户端，每个客户端负责小区域的交通流预测任务，因此定义交通流预测模型集合为. 假设的参数集合为，由于进行迁移学习之前需要进行域适应才能进行参数微调，因此模型的结构需要有所变化。首先考虑到目标域和源域的输入维度不一致，因此需要在模型前面增加若干层卷积神经网络层以对数据进行空间信息提取，最后为了保证输出与目标域相吻合，模型后面也需要增加若干层卷积神经网络层进行空间维度变换，假设前面以及后面增加的网络结构参数集合分别为和，则中的参数集合应为它们的并集，即。利用迁移学习保证了模型大部分参数不用重新训练，大大提高了训练的效率。

为了提高参数聚合时模型对时空信息的捕获能力，本发明设计了一种基于空间相似性的联邦参数聚合方法。该方法加强区域间交通信息联系，充分融合空间特性，可以利用相邻区域模型间参数的相似度来表示：

本发明提出的基于卷积神经网络模块的域适应算法可以有效地将源域与目标域空间维度不同的数据集进行匹配。