在做时间序列分析时,我们经常要对时间序列进行平稳性检验,而我们常用的软件是SPSS或SAS,但实际上python也可以用来做平稳性检验,而且效果也非常好,今天笔者就讲解一下如何用python来做时间序列的平稳性检验。
首先我们还是来简单介绍一下平稳性检验的相关概念。
图1. 平稳性序列的相关公式
时间序列的平稳性可分为严平稳和宽平稳。设{Xt}是一时间序列,对任意正整数m,任取t1、t2、t3、...、tm∈T,对任意整数τ,假如满足图1中式(1),则称时间序列{Xt}是严平稳时间序列。而宽平稳的定义为,如果{Xt}满足以下三个条件:
(1)任取t∈T,有E(Xt·Xt)
(2)任取t∈T,有E Xt =μ,μ为常数;
(3)任取t,s,k∈T,且k+s-t∈T,有γ(t, s)=γ(k, k+s-t)
则称{Xt}为宽平稳时间序列。
因为实际应用中我们很难获得随机序列的分布函数,所以严平稳用得极少,主要是使用宽平稳时间序列。
在了解了平稳性的基本概念之后,我们再来说一下平稳时间序列的意义。平稳时间序列的分析也遵循数理统计学的基本原理,都是利用样本信息来推测总体信息。这就要求分析的随机变量越少越好(也就是数据的维度越小越好),而每个变量获得样本信息越多越好(也就是数据的观测值越大越好),因为随机变量越少,分析过程越简单,样本容量越大,分析的结果越可靠。但时间序列的数据结构有其特殊性,它在任意时刻t的序列值