【时空流量预测笔记3】基于密集连接卷积神经网络的城市蜂窝流量预测

海拉鲁遗民

于 2024-04-15 16:06:48 发布

阅读量617

点赞数 17

文章标签：笔记人工智能

本文链接：https://blog.csdn.net/m0_58916821/article/details/137584173

版权

1.介绍

线性统计模型、机器学习模型……针对不同细胞的空间依赖性，[9]建立了一种自编码器与LSTM网络相结合的策略[10]。然而，通过自编码器学习到的特征是原始数据的有损表示[11]，可能无法完全表征相邻单元的空间依赖性。此外，上述方法主要集中在单个小区的流量预测上。如果应用于全市规模的网络，它们的计算成本很高，因为需要同时训练数百甚至数千个模型。

本文工作：密集连接的CNN是最先进的深度学习架构，它被用来集体模拟不同细胞中流量的时空依赖性。空间依赖性自然地被卷积运算捕获。使用两个cnn对两个时间相关性，即接近度和周期进行建模，并通过基于参数矩阵的方案进一步融合结果。

2.数据集和一些关键观察结果

A.数据集

米兰数据集，城市划分为H×W的网格，H=W=100，cell=100×100，流量数据记录的时间范围为 00:00 11/01/2013 - 00:00 01/01/2014，每隔10min记录一次。（但本文以1h作为时间单位）

在第t个时隙里，所有cell中的in、out流量：

B.数据观察

主要探讨了流量的时间相关性和空间相关性。（笔记1论文的叙述结构和本文很像，意义也一样，都是为了表明考虑时空相关性的合理性和重要性）

1）时间上：

流量的日规律性非常大，与工作日相比，周末流量会下降。短信进出流量的差异要比电话的差异明显得多。定义了平均流量比average traffic volume ratio：

τ是时隙间隔，求和部分是(T-τ)×H×W个比值的和，所以前面进行了平均处理。

该比值的值表示无线业务量在时间序列上的时间相关性，即相邻时隙的业务量在时间上的相关性大于分开时隙（τ较大时）的业务量的相关性。

2）空间上：

采用皮尔逊相关系数，即归一化的协方差，这里和笔记1的论文思路完全相同，略。

总之，预测模型需要同时捕获时空相关性。

3.预测模型

A.训练数据构建

预测目标是第t个时隙的流量（图上为14:00），则在此之前的历史流量数据可被分为两类：recent time and daily history，即距离目标时隙较近的近期数据（closeness）和每日的历史周期数据（period）（图中分别是Day n的11:00/12:00/13:00和Day n-1/.../Day n-q的14:00）

p和q分别是两类时间序列的长度。q*24是因为t是以小时为单位的。最终对[Xt-p,...Xt-1]和[Xt-q*24,...Xt-24]进行concat，得到Xc和Xd。（p个X张量concat，维度变为2p*H*W）

B.密集连接卷积神经网络

(k1,k2)的卷积核可以聚合k1*k2的cell的特征。利用CNN，在每一层进行一系列卷积后，可以捕获城市范围内流量的局部和全局空间依赖关系。

考虑到不同cell无论相邻还是相距较远，其进出流量都是相互依赖的，因此在CNN中采用密集连接模式，可以缓解梯度消失问题，加强特征传播，最终提高预测效率和精度。

如图所示，设计了两个具有共享结构的网络，一个用于建模时间紧密closeness依赖，另一个用于建模时间周期period依赖。网络结构共有L层，每层实现一个非线性变换 $f_{l}(\cdot )$ 。该变换是一个具有三个连续操作的复合函数，即卷积(Conv)，批量归一化(BN)和激活函数(ReLU)。

C.基于参数矩阵的融合

在网络的第l层上单独增加一个卷积层，得到基于参数矩阵的融合方案的特征（将closeness和period融合）。卷积层的输出分别为 $X_{c}^{L+1}$ ， $X_{d}^{L+1}$ 。

损失函数：最小化预测值和真实值的Frobenius范数来训练。（区别损失函数和评价指标）（arg min是指使后者min时变量θ的取值）

4.实验结果与分析

A.预处理和参数设置

在原始数据集的10分钟时间间隔内，有很大比例的小区流量为零，使得数据非常稀疏。此外，10分钟级的资源规划是一项非常困难的任务，可能会导致网络不稳定或开销过大。因此，本文以小时为单位统计流量值。

由于使用sigmoid函数来激活所提出模型的输出，因此使用Min-Max归一化将流量缩放为[0,1]。在评估中，预测值被重新调整回正常值，并与真实值进行比较。另外，选取最近7天的流量作为测试数据，之前的所有流量设置为训练数据。

优化算法采用adam。小批量是32batch，epoch=100，初始学习率设置为0.01，在总训练次数的50%和75%处除以10。

除了最后一层有2个大小为3 × 3的滤波器外，所有卷积层都有32个大小为3 × 3的滤波器。

对于相关序列的长度，p和q都设为3。采用均方根误差(RMSE)作为评价指标。

B.整体性能

用两种类型的数据集(SMS和Call)进行了实验。

Proposed-F：有基于参数矩阵的融合。Proposed：没有融合。

选择历史平均值(Historical Average value, HA)、ARIMA和LSTM三种算法作为基线。Call数据集上的RMSE值相对低于SMS数据集，因为Call数据集中隐藏的模式比SMS数据集更“规则”。

为了显示本文方法的收敛速度，每个历元后的训练损失如图所示。结果表明，在前20个epoch损失快速下降，在40个epoch后逐渐收敛到稳定状态，表明该方法的训练过程具有时间效率。

C.预测结果

在第130 ~ 160时段，即使流量变得不稳定，预测结果也与地面真实趋势吻合较好。可以有效地捕获和预测进出流量的峰值。

海拉鲁遗民

关注

17
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
【时空流量预测笔记3】基于密集连接卷积神经网络的城市蜂窝流量预测

线性统计模型、机器学习模型……针对不同细胞的空间依赖性，[9]建立了一种自编码器与LSTM网络相结合的策略[10]。然而，通过自编码器学习到的特征是原始数据的有损表示[11]，可能无法完全表征相邻单元的空间依赖性。此外，上述方法主要集中在单个小区的流量预测上。如果应用于全市规模的网络，它们的计算成本很高，因为需要同时训练数百甚至数千个模型。本文工作：密集连接的CNN是最先进的深度学习架构，它被用来集体模拟不同细胞中流量的时空依赖性。空间依赖性自然地被卷积运算捕获。
复制链接

扫一扫