前言: 作为探索数据的第一部分,本文先给出时间序列,自相关图,平稳性检验等概念。后续补充相应的python代码。该篇文章主要摘自王燕的《应用时间序列分析》,有兴趣深入了解的读者可参照这本书。
正文:
- 时间序列的定义:
拿到一组观察值序列之后,我们首先要对他的平稳性和纯随机性进行检验,这也叫做序列的预处理,根据检验的结果我们会采用不同的分析方法,也会用对应的不同模型。
- 描述时间序列的特征统计量
分别是均值,方差,自协方差,自相关系数,在探索数据时,根据它们我们能获得随机序列的一些性质,方便我们队数据有个直观了解。
自协方差函数和自相关系数是度量同一事件在不同时期之间的关联程度,直观点讲就是自己过去的行为对现在有没有影响,影响大不大。
3.宽平稳的概念:
有了均差,我们可以知道各个时期的均值是如何的,有了方差,我们可以了解各时期围绕着均值的波动如何有了自协方差函数,我们可以判断s时期和t时期的变量有没有关联,基于此,可以检验序列的平稳情况。
平稳就是围绕着一个常数上下波动
这里对(2)解释一下,对于任意时期t的均值都变成了常数,那么最终得到的均值序列的元素也都只是这个常数。而(3)的意思是只要间隔s-t相同,任意两对时间点的自相关函数相等。
- 平稳性的检验
检验的标准:平稳序列通常具有短期相关性。用自相关性系数来描述就是伴随着延迟期数k的增加,平稳序列的自相关系数会很快地衰减向0。反之非平稳序列的自相关系数衰减向0的速度通常比较慢
下面给出自相关图及其对应的时序图(一般来说时序图的描述比较笼统)
情况一:
对应的时序图如下
情况二:
对应的时序图如下
情况三:
对应的时序图如下
-
自相关系数的计算:
-
能解决的问题: