前情提要:经历了残酷的毕业论文写作申请学校面试等乱七八糟的事情之后,年更博主再度上线。上回说到,ARMA模型是一个数据生成过程,忘掉什么是数据生成过程的同学可以找上一篇复习一下。现在我们来探究一下这个模型的一些特质。
对于阿玛(ARMA)这样的线性模型来说,最重要的特质大概就是它的自相关方程(Autocorrelation Function, ACF)和偏自相关方程(Partial Autocorrelation Function, PACF)了。这两个东西非常厉害,厉害到什么地步呢?当你对大多数非经济学/统计学的同学讲这两个东西的时候,得到的回复基本上会是“Auto... what?”。开个玩笑,其实它们的重要性在于,它们可以描绘出一个线性线性时间序列数据生成过程的全部特征。下面我们展开来讲它们到底是个什么鬼。
ACF叫自相关方程。什么叫自相关?自相关就是自己和自己(的滞后项)的相关性。打个比方,你每天早餐都要吃一个可颂,那么你每天吃可颂这个行为就是自相关的,而且相关系数为1(不变);但是如果你和你的朋友每天都吃一个可颂,你们两个之间的关系就不叫自相关,而叫相关(cross correlation)。相关系数大家都会算,无非就是
自相关系数通常会使用
有时候我们会把自协方差(Autovariance)记作
对于一个时间序列来说,往前看和往后看是没什么差别的。怎么理解这一点呢?比如说我给自己定一个规矩,如果我在7天之前吃了个可颂当早餐,我今天就一定会吃一个可颂当早餐。也就是说我在每周的固定一天都会吃可颂(因为每周三买可颂送积分,手动划掉)。而这件事完全等价于如果我今天吃了一个可颂,我7天之后就一定会吃一个可颂,于是往前看和往后看就没什么差别了。故而
说了那么多,ACF(自相关方程)到底是个什么东西呢?通俗易懂一点讲,它就是把
PACF叫偏自相关方程,听起来很高大上,其实它比起ACF来说就是多了个P而已。偏(partial)这个概念指的是直接关系,想想偏微分的概念是什么大概就可以理解一下了。正式一点来说,偏自相关方程展现了滞后阶数和偏相关系数
当然,如果没看明白PACF是什么的话也大可不必慌张,毕竟估计你也没几个同学真的搞明白它是什么的不是。当然你实在要硬抠的话可以记住这个例子,不管我周二是不是(打赌输了)吃了100个可颂,我每周三都会吃一个可颂,雷打不动。
下面我们来说说ACF和PACF和阿玛模型有什么关系。我们先考虑一个协方差平稳(这个概念之后会讲)的AR(1)过程,它大概可以写成
滞后第二阶往下也可以用相同的办法得到,简单的迭代一下就好。
然后我们算一下方差。由平稳性可知,
这里的
PACF的计算相对而言比较困难,一般电脑也会自动帮忙算。但是很显然
MA模型和ARMA模型的ACF计算留到下次再讲,祝大家都能吃到不软不硬不混酥的可颂。