关于时间序列分析中的平稳性的理解笔记

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

为什么要平稳?

无非就是希望能根据平稳的数据更好更准确的预测未来。非平稳性的时间序列数据太过于杂乱无章,有的甚至完全无规律可循,但是平稳时间序列本身存在某种分布规律,前后具有一定自相关性且能够延续下去,进而可以利用这些信息帮助预测未来。


一、什么是平稳性?

时间序列的平稳性是指一组时间序列数据看起来平坦,各阶统计特征(如均值、方差、协方差…)不随时间的变化而变化。其数学定义又分为严平稳和宽平稳。

二、时间序列中的不平稳性

时间序列的不平稳性(non- stationarity)是一个比较难处理,且真实世界中很常见的可题。时间序列的不平稳性指的是随着时间的变化,观测值的均值、方差等统计量发生变化。不平稳性会导致在训谢练集训练的模型,在测试集上效果较差,因为训练集和测试集属于不同时间,而不同时间的数据分布差异较大。

业内解决这种统计量随时间变化的不平稳问题主要方法是,对时间序列数据做一些诸如归一化等平稳化处理。例如对每个序列样本使用z- normalization处理成0均值1方差的,这样就可以解決不同时间步的样本统计量不一致的可题。但是这种解決方法会对Transformer模型帯来一个负面影响:平稳化后的序列虽然統计量一致了,但是这个过程中也让数据损失了ー些个性化的信息,导致不同序列的 Transformer中的 attention矩阵趋同。文中将这个现象叫作over- stationarization。

例子

在这里插入图片描述
在第一幅图中,我们可以清楚地看到,均值随时间而变化(增加),呈现上升的趋势。因此,这是一个非平稳序列。对于一个平稳的时间序列,它不应该呈现出随时间变化趋势。

在第二幅图中,我们肯定看不到序列的趋势,但是序列的变化是一个时间的函数。正如前面提到的,平稳序列的方差必须是一个常数。

再来看第三幅图,随着时间的增加,序列传播后变得更近,这意味着协方差是时间的函数。

上述三个例子均表示非平稳时间序列。现在来看第四个图:
在这里插入图片描述
在这张图中,均值、方差和协方差都是常数,这就是平稳时间序列。

再想一想,用上面的哪一幅图来预测未来的值会更容易呢?第四个图,对吧?大多数统计模型要求序列是平稳的,才能进行有效和精确的预测。

因此,总的来说,平稳时间序列是一个不依赖时间变化 (即均值、方差和协方差不随时间变化)的时间序列。在下一节中,我们将介绍各种检测给定序列是否平稳的方法。

时间序列的平稳化

在熟悉了平稳性的概念及其不同的类型之后,接下来可以对序列进行平稳化操作。请记住,为了利用时间序列预测模型,必须首先将任何非平稳序列转换为平稳序列。

差分化

在该方法中,计算序列中连续项的差值。执行差分操作通常是为了消除均值的变化。从数学角度,差分可以写成:

yt‘ = yt – y(t-1)

其中yt 是t时刻的数值。

季节性差分

在季节性差分中,不计算连续值之间的差异,而是计算观测值与同一季节的先前观测值之间的差异。例如,星期一的观察值将与上星期一的观察值相减。从数学角度,它可以写成:
yt‘ = yt – y(t-n)

变换

变换用于对方差为非常数的序列进行平稳化。常用的变换方法包括幂变换、平方根变换和对数变换。

总结

以上就是今天总结的内容,本文仅仅简单对时间序列中的平稳性做了笔记。

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值