二、时间序列的预处理

一般情况下,拿到一个观察值序列之后,首先要对它的平稳性纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。

一、平稳性检验

1、特征统计量

(1)概率分布

          数理统计的基础知识告诉我们分布函数或者密度函数能够完整地描述一个随机变量的统计特征。同样,一个堆积变量族{Xt} 的统计特征也完全由它们的联合分布函数或联合密度函数决定。

           当由于在实际应用中,要想得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因导致我们很少直接使用联合概率分布进行时间序列分析。

(2)特征统计量

         一个更简单的、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称之为特征统计量。  

        尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些特征量的统计特性,推断出随机序列的性质。 
1.均值 
2.方差 
3.自协方差函数(autocovariance function)和自相关系数(autocorrelation coefficients)

(3)自协方差函数与协方差函数的区别

        通常的协方差函数和自相关系数度量的是两个不同事件彼此之间的相互影响程度,而协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。

2.平稳时间序列的定义 

   根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列 

(1)严平稳(strictly stationary)

         一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才被认为平稳。随机变量族的统计性质由它们的联合概率分布族决定 。
        在实际中,要想获得随机序列的联合分布式一件非常困难的事,所以严平稳时间序列通过只有理论意义,在实践中更多的是条件比较宽松的平稳时间序列。

(2)宽平稳(week stationary)

      使用序列的特征统计量来定义一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶平稳(二阶),就能保证序列的主要性质近似稳定。 

在实际应用中,研究中最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特殊注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。

        要证明某个随机过程是否是宽平稳过程(广义平稳过程)就必须的满足以上定义中的三个条件:

(1)E[X(t)]=μ(常数)

(2)E[X(t) X(t + h)]= γ( h ) ;(自协方差函数只与时间间隔有关,与起始点无关)

(3)E[X2(t)< +∞ 。

      严平稳比宽平稳条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序列不能反推平稳成立。

        这个不是绝对的,两种情况都有特例:

         比如服从可惜柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩,所以无法验证它二阶平稳。严格地讲,只有存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。

3.平稳时间序列的统计性质

(1)常数均值

(2)自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起始点无关

4.平稳性的检验

      一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。 图检验是一种操作简便,运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验的方法加以辅助判断。目前最常用的平稳性检验方法是单位根检验(unit root test)。 

(1)时序图检验 

根据平稳时间序列均值、方差Wie常数的性质,平稳时间序列的时序图应该是显示出该数列始终在一个常数值附近随机波动,而且波动的范围有界的特点。

 

 

(2)自相关图检验

       自相关图就是一个平面二维坐标垂线图,一个坐标轴表示延迟时期数,另一个坐标轴表示自相关系数,通过以垂线表示自相关系数的大小。

       平稳时间序列通常具有短期相关性,该性质使用自相关系数来描述就是随着延迟期数k的增加,平稳时间序列的自相关系数ρ会很快地衰减为0;反之,非平稳序列的自相关系数ρ衰减向0的速度通常会比较慢,这就是利用自相关图进行平稳性判断的标准。

二、纯随机性检验

     当拿到一个观察值序列之后,首先是判断它的平稳性,通过平稳性检验,序列可以分为平稳序列和非平稳序列两大类。

      对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析要周折一些,通常要进行进一步的检验、变换或处理之后,才能确定适当的拟合模型。 
       如果序列平稳,情况就简单多了,我们有一套非常成熟的平稳序列建模方法。但是,并不是所有的平稳序列都值得建模。只有那些序列值之间具有密切的相关关系,历史数据对未来的发展有一定影响的序列,才值得我们花时间去挖掘历史数据中的有效信息,用来预测序列未来的发展。 
        如果序列值彼此之间的任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有任何的影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。 

1、纯随机性检验

        纯随机性检验也称为白噪声检验,是专门用来检验序列是否为随机序列的一种方法。如果一个序列是纯随机序列,那么它的序列值之间应该是没有任何相关关系。

 

2、假设条件

由于序列之间的变异性是绝对的,而相关性是偶然的,所以假设条件如下确定:

  • 原假设:延迟期数小于或等于m期的序列值之间相互独立。
  • 备选假设:延迟期数小于或等于m期的序列值之间有相关性。

3、检验统计量

(1)Q统计量

Box和Pierce推导出了Q统计量

根据正态分布和卡方分布之间的关系,我们很容易推导出Q统计量近似服从自由度为m的卡方分布:

 

当Q统计量大于卡方分布的分位点,或者统计量的P值小于a时候,可以以1-a的置信水平拒绝原假设,认为该序列为非白噪声序列,否则,接受原假设,认为序列为纯随序列。

(2)LB统计量

在实际应用中人们发现Q统计量在大样本长夜(n很大的场合)检验效果很好,但是在小样本场合就不太精确,为了弥补这一缺陷,Box和Ljong又推导出LB统计量

 

Box和Ljung证明LB统计量同样近似的服从自由度为m的卡方分布。
实际上LB统计量就是Box和Pierce的Q统计量的修正,所以人们习惯上吧他们统称为Q统计量,分别纪委QNP和QLB统计量,在各种检验场合普遍采用的Q统计量通常指的就是LB统计量。

注意:一般情况下我们只检验前6期和前12期的Q统计量和LB统计量就可以直接判断该序列是否为白噪声序列。这是因为,

 1、平稳序列通常具有短期相关性,如果序列之间存在明显的相关关系,通常指存在于延迟时期比较短的序列值之间,所以,如果一个平稳序列的短期延迟值之间不存在显著的相关关系,通常长期之间就更不会存在显著的相关关系。

2、假如一个平稳序列显示出短期显著的短期相关性,那么该序列就一定不是白噪声序列,我们就可以继续对该序列进行相关性分析。

  • 6
    点赞
  • 63
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值