先看下图:
这是1986年到2006年的原油月度价格。可见在2001年之后,原油价格有一个显著的攀爬,这时再去假定均值是一个定值(常数)就不太合理了,也就是说,第二讲的平稳模型在这种情况下就太适用了。也因此有了今天这一讲。
要处理这种非平稳的数据(比如上图中的均值不是一个常数),需要用非平稳模型:求和自回归滑动平均(Autoregressive integrated moving average, ARIMA)。接下来,咱先看一个处理过的石油价格:
是不是似曾相识?! 对的,经过简单的处理,本来不平稳的数据,立即变成了平稳数据了。这样再用上一章的模型就可简单处理了。这种处理方式就叫做差分(马上会讲,别急)。 而ARIMA 模型可以简单的理解为:差分+平稳模型。你看,这下,这章的内容是不是简单多了,所谓非平稳模型不就是差分处理下数据,再变有平稳数据,然后再用平稳模型处理嘛~ 确实酱紫~。
那马上就产生一个问题(或者你早就有疑问了):什么叫做差分?差分是处理时间序列非常重要的工具,在计量经济学及金融数学中广泛应用。
3.1 差分运算
3.1.1 差分运算
还是用原油价格(月度数据)作为例子,所谓一阶差分就是两个相邻月度之间做差。(这么简单?!对,就是这样~)。
规范化些:设{ Xt, t=±1,±2,…}
为一时间序列,则:称为时间序 { Xt, t=±1,±2,…}
的一阶差分运算。
比如 2005年原油价格为:46.84 ,48.15, 54.19, 52.98, 49.83, 56.35, 58.99, 64.98 ,65.59, 62.26, 58.32 ,59.41。那这组数据的一阶差分即为 1.31, 6.04, -1.21, -3.15, 6.52 , 2.64 , 5.99 , 0.61,-3.33, -3.94,也就是前一个数减去后一个数而已。
那如果我想去差分后的数据再做一次差分呢? 那就是二阶差分(就是这么easy~):上面的一阶差分数据为1.31, 6.04, -1.21, -3.15, 6.52 , 2.64 , 5.99 , 0.61,-3.33, -3.94,再经一次差分: 4.73 , -7.25, -1.94, 9.67, -3.88, 3.35 , -5.38 , -3.94, -0.61.
那如果想做p次呢(你够了~),那就叫做p阶差分了,定义为:
是不是很简单?!
3.1.2 k步差分
如果不是相邻数据间做差呢,比如我想隔几个数据叫,比如我想用原油数据7月份数据与1月份做差呢? 没问题,你的需求我一定满足,这个就叫做k步差分了:
比如2005年7月与1月的价格差值即为: 58.99 - 46.84 = 12.15.也即称为六步差分了。
3.1.3 差分的选择
划重点,划重点!!!
- 序列蕴含着显著的线性趋势,1 阶差分可以实现趋势平稳,比如上面的原油价格(不过,里面其实做了一个预处理,一会说~).
- 序列蕴含着曲线趋势的,通常低阶(2阶或3阶)差分就可以取提出曲线趋势的影响.
- 对于固定周期的序列,通常进行步长为周期长度的差分就可以较好的提取周期信息.
PS: 差分虽好,但也不要贪杯哦, 记住对信息的任何的加工都只会造成信息的损失.
3.1.3* 延迟算子
这一小节作为了解,不喜欢可以_跳过_,不影响理解滴~。
延迟算子,类似一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拔了一个时刻。(ps: 算子就是映射,就是关系,就是变换[3])
3.1.3.1定义与性质
记 B 为延迟算子,有:xt−1=Bxt,xt−2=B2xt,…,xt−p=Bpxt−p
延迟算子具有如下性质:
- B0
对任意两个序列 有{ xt},{ yt},有B(xt±yt)=xt−1±yt−1
Bnxt=xt−n
其