摘要
空间-时间预测系统在解决众多现实问题中扮演着关键角色。本文提出了一种全新的框架——TimeXer,用以利用外生变量(exogenous variables)增强时间序列预测的准确性。该方法通过一个设计精巧的嵌入层赋予Transformer架构处理内生变量(endogenous variables)和外生变量的能力。在此过程中,采用了片状自注意力机制和变量间的交叉注意力。此外,TimeXer引入了全局内生变量令牌,有效地将外生序列的信息传递至内生的时间片段中。实验表明,TimeXer在十二个真实世界的预测基准中,显著提升了预测准确性,且在各项评估中表现优异。
论文地址:https://arxiv.org/pdf/2402.19072
1. 引言
时间序列预测在天气、电力市场和交通领域应用广泛。现有的预测方法主要分为单变量、多变量预测,以及本文所提出的包含外生变量的预测。外生变量在实际应用中具有重要意义,因为许多时间序列数据的变化受外部因素的影响,比如电力价格与市场供需的关系。本文的重点是如何有效地利用外生变量来提高预测的准确性。
2. 相关工作
时间序列预测模型包括基于RNN、CNN、MLP和Transformer的模型。现有的Transformer模型虽然在捕捉时间依赖性上表现出色,但大多未对外生变量做特殊处理。本文提出的TimeXer,旨在填补这一空白,通过交叉注意力机制,将外生变量的信息有效地融入内生变量的预测中。
3. TimeXer模型设计
TimeXer的架构基于标准的Transformer,无需修改任何组件。模型通过内生和外生变量的不同嵌入方式,分别使用自注意力捕捉内生变量的时间依赖性,并通过交叉注意力捕捉变量间的关联。特别地,内生变量的嵌入被分为多个时间片段,而外生变量则通过全局嵌入以系列令牌的形式参与交叉注意力的计算。
4. 实验
实验在多个真实数据集上进行了验证,结果表明TimeXer在短期和长期预测任务中均能有效利用外生信息,显著提高了预测性能。此外,还通过不同的对照实验验证了TimeXer对低质量数据的鲁棒性。
5. 结论
本文提出的TimeXer通过一个精巧的嵌入策略,实现了对内生和外生变量的有效处理,显著提升了时间序列预测的准确性,尤其是在包含外生变量的复杂场景中。
总结
优点:
- 高效利用外生变量:TimeXer通过交叉注意力机制有效地整合了外生变量的信息,使其能够显著提升对内生变量的预测准确性。
- 模型通用性强:该模型可以在不修改Transformer架构的基础上,处理多种复杂的时间序列预测任务,尤其是包含外生变量的场景。
- 鲁棒性:TimeXer在面对低质量的外生数据时,仍能保持较好的预测性能,表现出对数据不完整性的强鲁棒性。
缺点:
- 复杂度较高:虽然模型能够处理外生变量,但由于其引入了额外的交叉注意力机制和全局变量令牌,使得在大规模数据集上的计算成本较高。
- 依赖外生数据的完整性:尽管模型对低质量数据有一定鲁棒性,但当外生变量缺失较为严重时,模型性能仍可能下降。
创新点:
- 片状自注意力与变量间交叉注意力结合:TimeXer提出了结合片状自注意力和变量间交叉注意力的机制,使得模型既能捕捉时间依赖性,又能有效地挖掘内外生变量之间的关联。
- 全局内生变量令牌:通过全局变量令牌,TimeXer将外生信息传递至内生时间片段中,增强了模型对外生变量的利用。
可改进点:
- 计算复杂度的优化:未来可以考虑通过压缩注意力机制或简化交叉注意力的计算,来降低模型在大规模数据集上的计算成本。
- 处理非周期性时间序列:目前TimeXer较适合处理具有周期性的时间序列。未来的改进可以考虑如何在非周期性数据上提升模型表现。
总的来说,TimeXer在时间序列预测领域提供了一个有效的解决方案,尤其是在处理外生变量时表现优异,但在计算复杂度和模型适应性上仍有提升空间。