论文笔记：Non-stationary Transformers: Rethinking the Stationarity in Time Series Forecasting

UQI-LIUWJ

已于 2024-01-08 21:19:02 修改

阅读量1.2k

点赞数 10

分类专栏：论文笔记文章标签：论文阅读

于 2023-12-19 01:09:35 首次发布

本文链接：https://blog.csdn.net/qq_40206371/article/details/135073206

版权

论文笔记专栏收录该内容

356 篇文章

订阅专栏

本文探讨了不平稳时间序列预测中的挑战，提出了一种新的Transformer结构Non-stationaryTransformers，通过结合归一化和预测结果反平稳化，以及De-stationaryAttention机制，让Transformer能够学习并保持序列的个性化特征。实验展示了这种方法的有效性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

不平稳时间序列预测问题的Transformer

1 intro

1.1 背景

时间序列的不平稳性（non-stationarity）是一个比较难处理，且真实世界中很常见的问题
- 不平稳性指的是随着时间的变化，观测值的均值、方差等统计量发生变化
- 不平稳性会导致在训练集训练的模型，在测试集上效果较差
  - 因为训练集和测试集属于不同时间，而不同时间的数据分布差异较大。
目前解决这种统计量随时间变化的不平稳问题主要方法是，对时间序列数据做一些诸如归一化等平稳化处理
- 例如对每个序列样本使用z-normalization处理成0均值1方差
- 但是这种解决方法会对Transformer模型带来一个负面影响：
  - 平稳化后的序列虽然统计量一致了，但是这个过程中也让数据损失了一些个性化的信息，导致不同序列的Transformer中的attention矩阵趋同
    - over-stationarization
- 对于一个序列的3个时间窗口的子序列，不进行归一化处理的attention分布差别过大
- 使用了归一化处理后，3个序列的attention分布趋同了，缺失了各自的特征信息