时间序列分析

目录

1. 简单介绍一下

1.1 时间序列定义

1.2 时间序列分析方法

1.2.1 描述分析法

1.2.2 确定性因素分解方法

1.2.3 随机性因素分解方法

1.2.4 时域分析方法

2. 时间序列的预处理

2.1 平稳性检验

2.1.1 平稳时间序列的定义

2.1.2 平稳时间序列的统计性质

2.1.3 检验方法

2.2 纯随机性检验

2.2.1 纯随机序列的定义

2.2.2 纯随机序列的性质

2.2.3 检验

3. 平稳时间序列分析

3.1 Wold分解定理

3.1.2 wold分解定理中随机性序列性质

3.1.3 波动序列的方差

3.2 AR模型

3.2.1 AR模型的定义

3.2.2 AR模型平稳性判别

3.2.3 平稳AR(p)模型的统计性质

3.3 MA模型

3.3.1 定义

3.3.2 统计特征

3.3.3 MA模型的可逆性

3.4 ARMA模型

3.4.1 定义

3.4.2 平稳条件和可逆条件

3.4.3 统计性质

3.5 拟合与预测

3.5.1 建模步骤

3.5.2 单位根检验

3.5.3 模型识别

3.5.4 参数估计

3.5.5 模型检验

3.5.6 模型预测

4. 非平稳序列的确定性分析

4.1 确定性因素分析

4.2 趋势分析

4.2.1 趋势拟合法

4.2.2 平滑法

4.3 季节效应分析

5. 非平稳序列的随机分析

5.1 差分运算

5.1.2 差分的类型

5.1.2 Cramer分解定理

5.1.3 差分方式的选择

5.1.4 需要注意的事项

5.2 ARIMA模型

5.2.1 ARIMA模型的结构

5.2.2 ARIMA模型族

5.2.3 ARIMA模型的性质

5.2.4 ARIMA模型建模过程

5.2.5 ARIMA模型的预测

5.2.6 ARIMA疏导模型

5.2.7 简单季节模型

5.2.8 乘积季节模型

5.3 Auto-Regressive 模型

5.3.1 模型定义

5.3.2 检验残差序列自相关性

5.3.3 拟合残差序列

6. 多元时间序列分析

6.1 平稳多元时间序列建模

6.2 虚假回归

6.3 单位根检验

6.4 协整

6.4.1 单整

6.4.2 协整

6.4.3 协整检验

6.4.4 建模

6.5 误差修正模型 ECM


1. 简单介绍一下

1.1 时间序列定义

(1) 随机序列:按时间顺序排列的一组随机变量

(2) 观察值序列:随机序列的n个有序观察值,序列长度为n。

1.2 时间序列分析方法

1.2.1 描述分析法

1.2.2 确定性因素分解方法

认为所有序列波动均可归纳为受到四个因素的影响:

即长期趋势,循环波动,季节性变化,随机波动。

1.2.3 随机性因素分解方法

也称频域分析方法,谱分析法。

1.2.4 时域分析方法

从序列自相关角度揭示时间序列发展规律。

(1) 定理

a. Wold分解定理

所有平稳序列都可以分解为确定性序列和随机序列之和,是构造ARMA模型拟合平稳序列的理论基础。

b. Cramer分解定理

Wold模型的推广,是非平稳序列的分解理论,构造ARIMA模型的理论基础。

(2) 方法

a. ARIMA模型

主要应用于单变量、同方差的线性模型。

b. ARCH模型

条件异方差模型较之更适合异方差场合。当然ARCH的扩展衍生模型也很多。

c. ARIMAX模型

用于多元平稳序列构建回归模型。此后Granger提出协整的概念,解决了多元回归无法判断是否存在伪回归的问题。

d. SYSLINE模型(联立线性方程组模型)

e. VAR模型(向量自回归模型)

f. TAR模型(门限自回归模型)

可以进行非线性时序分析。

2. 时间序列的预处理

对于时间序列 \left \{ X_t|t\in T \right \}的概率分布由其有限维分布族定义。由于要得到联合概率分布可能性几乎为0,因此实际应用中研究特征统计量。

(1) 均值:

(2) 方差

(3) 自协方差

(4) 自相关系数

2.1 平稳性检验

2.1.1 平稳时间序列的定义

(1) 严平稳

较为严苛,认为序列的所有统计性质均不随时间推移而发生变化。

(2) 宽平稳

认为序列特征统计量(二阶的低阶矩)平稳则序列主要性质近似平稳。

二者之间的关系:当二阶矩存在时,严平稳一定是宽平稳。序列服从多元正态分布(正态时间序列)时,宽平稳可以推出严平稳。

正态时间序列:\left \{ X_t|t\in T \right \}若为正态时间序列, 任取正整数n,任取 t_1,t_2,...,t_n\in T,对应有限维随机变量服从n维正态分布,密度函数仅与均值向量、自协方差阵有关。

2.1.2 平稳时间序列的统计性质

(1) 常数均值

EX_t=\mu (\forall t\in T)

(2) 自协方差函数and自相关函数

自协方差函数和自相关函数与时间起止点无关,仅依赖于时间平移长度有关。

\gamma (t,s)=\gamma (k,k+s-t)=\gamma (s-t)(s,k,t\in T)

延迟k自协方差函数

\gamma (k)=\gamma (t,t+k)

延迟k自相关系数

\rho _k=\frac{\gamma (t,t+k)}{\sqrt{DX_t\cdot DX_{t+k}}}=\frac{\gamma (k)}{\gamma (0)}       (方差为 DX_t=\gamma (t,t)=\gamma (0))

(3) 自相关系数的性质

a. 规范性:\rho _0=1,|\rho _k|<1

c. 对称性:\rho _k=\rho _{-k}

d. 非负定性:对任意的正整数m,相关阵 \tau _m为对称非负定阵。

\tau _m=\bigl(\begin{smallmatrix} \rho _0 & \rho _1 &... & \rho _{m-1}\\ \rho _1 & \rho _0 & ... & \rho _{m-2}\\ ...&... &... & \\ \rho _{m-1} & \rho _{m-2} & ... &\rho _0 \end{smallmatrix}\bigr)

d. 非唯一性:

一个平稳时间序列唯一决定自相关系数,然而自相关系数未必唯一决定平稳时间序列。

2.1.3 平稳时间序列的定义

数据结构:多个随机变量,每个变量只有一个观测值。传统统计分析的数据结构往往是每个变量有多个观测值。

(1) 序列均值等于常数

即均值序列从原本含有多个随机变量的情况转变为含有一个变量的常数序列,即

\left \{ \mu _t,t\in T \right \}\rightarrow \left \{ \mu ,t\in T \right \}

(2) 由于平稳性,极大减少了随机变量的个数,增加了带估计变量的样本容量,提高了对特征统计量估计的精度。

(3) 样本自协方差函数

a. 延迟k自协方差函数的样本估计

\widehat{\gamma (k)}=\frac{1}{n-k}\sum_{t=1}^{n-k}(x-\overline{x})(x_{t+k}-\overline{x})

b. 总体方差样本估计

\widehat{\gamma (0)}=\frac{1}{n-1}\sum_{t=1}^{n}(x_t-\overline{x})^2

c. 延迟k阶自相关系数样本估计

\widehat{\rho _k}=\frac{\widehat{\gamma (k)}}{\widehat{\gamma (0)}}

2.1.3 检验方法

(1) 图检验

有一定主观性。

a. 时序图检验

序列始终在一个常数值附近波动,且波动范围有界,这是因为平稳序列具有常数常数均值和方差。若是显示出较明显的周期性或者趋势,那自然不是平稳序列。

 如图,显然具有递增的趋势,是非平稳序列。

b. 自相关图

自相关图是一个平面二维坐标悬垂线图,横坐标表示延迟期数,纵坐标表示自相关系数。

由于平稳序列通常具有短期相关性,因此相关系数随着延迟期数k的增加会快速衰减到0;而非平稳序列相关系数衰减通常较慢。

如上图,该序列延迟15阶之后依然显著非0,显然是非平稳序列。

(2) 假设检验

根据特征根是否在单位圆内判断平稳性,较为客观。

2.2 纯随机性检验

并不是所有平稳序列都值得建模,只有序列值之间有密切相关关系,历史数据为未来发展有一定影响的才值得建模挖掘历史数据中的有效信息。因此需要纯随机性检验。

2.2.1 纯随机序列的定义

又名白噪声序列。序列值之间没有任何相关性。也就是说没有任何实际分析的价值。

满足性质:

(1) E(X_t)=\mu ,\forall t\in T

(2) \gamma (t,s)=\left\{\begin{matrix} \sigma ^2 & t=s\\ 0&t\neq s \end{matrix}\right.

注意:白噪声序列一定是平稳序列,且是最简单的序列。

2.2.2 纯随机序列的性质

(1) 纯随机性

各序列值之间没有相关关系,\gamma (k)=0\rho _k=0(\forall k\neq 0)

(2) 方差齐性

D(X_t)=0

注意:一个序列值的相关信息全部提取干净后残差序列应该具有方差齐性。所以检验是否具有方差齐性相当于检验序列中的信息是否提取完全。

如图即是纯随机序列的自相关图。

2.2.3 检验

Barlett定理:

如果一个序列是纯随机序列,观察期数为n,则该序列的延迟非零期的样本自相关系数会服从均值为零,方差为序列观察期数n的倒数的正态分布。

\rho _k\sim N(0,1/n)

提出假设:原假设:延迟期数小于等于m的序列值之间相互独立,即

  H_0:\rho _1=\rho _2=...=\rho _m=0

根据该定理构造统计量:

Q统计量:

Q=n\sum_{k=1}^{m}\widehat{\rho _k}^2\sim \chi ^2(m)   (适合大样本)

LB统计量:

LB=n(n+2)\sum_{k=1}^{m}(\frac{\widehat{\rho _k}^2}{n-k})\sim \chi ^2(m)  (适合小样本,是对Q统计量的修正,较为准确)

随后进行卡方检验即可。

注意:通常只检验前12期延迟。因为平稳序列通常具有短期相关性,若短期延迟的序列值之间都没有相关性,那么长期就更没有了。另一方面是因为,如果序列具有短期相关性,则不可能是白噪声序列了,不必继续检验。

3. 平稳时间序列分析

3.1 Wold分解定理

即平稳序列分解定理,任意一个离散平稳时间序列 \left \{ x_t \right \} 都可以分解为两个不相关的平稳时间序列之和,其中一个是确定性的,另外一个是随机性的,可以记作 x_t=v_t+\xi _t 。

3.1.1 wold分解定理中确定性序列性质

序列的当期波动可以由其历史序列值解读的部分。不管它关于时间的函数是怎样的,都可以等价表达成历史序列值的线性函数:

V_t=\sum_{j=1}^{n} \phi _j x_{t-j}

3.1.2 wold分解定理中随机性序列性质

不能由历史序列解读的随机波动部分,可以表示为:

\xi _t=\sum_{j=0}^{n}\theta _j\varepsilon _{t-j}

通常假定 \theta _0=1,\sum_{j=0}^{\infty } \theta _j^2<\infty

注意:式中的 \left \{ \varepsilon _t \right \} 称作新息过程,是每个时期加入的新的随机信息,相互独立,不可预测,记作 \varepsilon _t\sim N(0,\sigma _\varepsilon )

3.1.3 波动序列的方差

对任意平稳序列 {yt},令yt关于q期历史序列值作线性回归:

y_t=a_0+a_1y_{t-1}+a_2y_{t-2}+...+a_py_{t-p}+v_t

其中,{vt} 为回归残差序列,记其方差为 Var(v_t)=\tau _q^2,(0<\tau _q^2<Var(y_t)) 。

注意: \tau _q^2 随着q的增大单调非增,即方程中历史期数越多,则对现时值的预测精度越高。显然\tau _q^2越大,说明序列随机性越大,对现时值的预测越不精确。

如果 \lim_{p\rightarrow \infty } \tau _q^2=0,说明历史序列几乎可以完全未来波动,此时,可以称作确定性序列。

 如果\lim_{p\rightarrow \infty } \tau _q^2=Var(y_t),说明历史序列几乎对未来波动的预测无作用,此时称纯随机序列。

3.2 AR模型

3.2.1 AR模型的定义

具有如下结构的函数称作p阶自回归函数,记作AR(p):

\left\{\begin{matrix} x_t=\phi _0+\phi _1x_{t-1}+...+\phi _px_{t-p}+\varepsilon _t \\ \phi _p\neq 0 \\ E(\varepsilon _t)=0,Var(\varepsilon _t)=\sigma _\varepsilon ^2,E(\varepsilon _s\varepsilon _t)=0 ,(s\neq t)\\ E(x_s\varepsilon _t)=0,(\forall s<t) \end{matrix}\right.

尤其是当 \phi _p=0 时,称作中心化AR(p)模型。

非中心化AR(p)模型的中心化:令 \mu =\frac{\phi _0}{1-\phi_1 -\phi_2-...- \phi_p },y_t=x_t-\mu,称{yt}是{xt}的中心化序列。

(1) 自回归系数的多项式

AR(p)模型又可以记作:\phi (B)x_t=\varepsilon _t

其中,\Phi (B)=1-\phi _1B-\phi _2B^2-\phi _3B^3-...-\phi _pB^p 称作p阶自回归系数多项式,B称作延迟算子。

(2) 延迟算子

延迟算子类似于一个时间指针,序列值每乘以一个延迟算子就相当于把这个序列值往回拨了一个时刻,如 x_{t-1}=Bx_t,x_{t-2}=B^2x_t,...,x_{t-p}=B^px_t 。

因此可以将AR(p)模型改写为下面的形式:

\Phi (B)x_t=(1-\phi _1B-\phi _2B^2-...-\phi _pB^p)x_t=x_t-\phi _1x_{t-1}-...-\phi _px_{t-p}=\varepsilon _t

基本性质如下:

a. B^0=1

b. B(cx_t)=cB(x_t)=cx_{t-1},c可以为任意常数

c. B(x_t\pm y_t)=x_{t-1}\pm y_{t-1}

d. (1-B)^n=\sum_{i=0}^{n}(-1)^i C_{n}^{i}\textrm{B}^i,C_{n}^{i}\textrm{}=\frac{n!}{i!(n-i)!}

3.2.2 AR模型平稳性判别

要拟合平稳时间序列,那么模型显然也需要是平稳的,所以接下来需要来探索检验AR(p)模型的平稳性的方法。

(1) 特征根判别法

称下列形式的方程为序列{xt}的p阶线性差分方程:

x_t+a_1x_{t-1}+a_2x_{t-2}+...+a_px_{x-p}=h(t)

其中,a1,a2...ap为实数,h(t)为某个已知的函数。

尤其是当h(t)=0时,称作p阶齐次线性差分方程。由高代知识知道求解齐次线性差分方程需要借助它的特征根和特征方程。

p阶齐次线性差分方程的解:

p阶齐次线性差分方程的特征方程如下:

\lambda ^p+a_1\lambda ^{p-1}+a_2\lambda ^{p-2}+...+a_p =0

为一个1元p次方程,有p个非零特征根,记作 \lambda _1,\lambda _2,...,\lambda _p

根据差分方程理论,我们知道特征根的t次方也是方程的阶,以及这些解的线性组合也是该齐次线性差分方程的解,因此我们可以得到p阶齐次线性差分方程的通解如下:

f(t)=c1\lambda _1^t+c_2\lambda _2^t+...+c_p\lambda _p^t

p阶非齐次线性差分方程的解:

其实它的解 f(t) 就相当于齐次线性差分方程的通解 f_1(t) 加上一个特解 f_0(t) ,即:

f(t)=f_1(t)+f_0(t)

其中,特解指使得方程成立的任意一个解,即 f_0(t)+a_1f_0(t-1)+...+a_pf_0(t-p)=h(t)

平稳序列的解:

任意平稳序列可以表示为如下的p阶线性差分方程,因此可以据此求出它的通解。

x_t-\phi_1 x_{t-1}-...-\phi _px_{x-p}=\varepsilon _t

特征方程为:\lambda ^p-\phi _1\lambda ^{p-1}-...-\phi _{p}=0

假设 f_0(t) 为序列的特解,则可以得到它的通解为 f(t)=c_1\lambda _1^t+c_2\lambda _2^t+...+c_p\lambda _p^t+f_0(t) 。

特征根的判别:

因为序列值需始终在均值附近波动,不可以随时间发散,因此

\lim_{t\rightarrow \infty }x_t=\lim_{t\rightarrow \infty }[c_1\lambda _1^t+c_2\lambda _2^t+...+c_p\lambda _p^t+f_0(t)]=\mu

若要保证上式对任意实数都成立,那么就首先需要保证每个特征根的幂函数都不会发散,因此推导出每个特征根的绝对值都小于1。

即当 |\lambda _i|<1,(i=1,2,...,p) 成立时序列平稳,称作特征根判别法。

与此等价的是:

\Phi (u)=1-\phi _1u-...-\phi _pu^p=0,u_i=\frac{1}{\lambda _i},(i=1,2,...,p) ,当 |u_i|>1 成立时序列平稳。

其中,ui为p阶自回归系数多项式的特征根。

(2) 平稳域判别法

低阶自回归模型用这个方法通常更加简便。

AR(1)模型的平稳条件:

方程结构:x_t-\phi x_{t-1}=\varepsilon _t

特征根:\lambda =\phi

平稳域:\left \{\phi | -1<\phi <1 \right \}

AR(2)模型的平稳条件:

方程结构:x_t-\phi _1x_{t-1}-\phi _2x_{t-2}=\varepsilon _t

特征根:\lambda _1=\frac{\phi _1+\sqrt{\phi _1^2+4\phi _2}}{2},\lambda _2=\frac{\phi _1-\sqrt{\phi _1^2+4\phi _2}}{2}

平稳域:\phi _2=|\lambda _1\lambda _2|<1,\phi _2+\phi _1=-\lambda _1\lambda _2+\lambda _1+\lambda _2,\phi _2-\phi _1=-\lambda _1\lambda _2-\lambda _1-\lambda _2

即 \left \{ \phi _1,\phi _2||\phi _2|<1,\phi _1\pm \phi _2<1 \right \}

AR(p)模型的平稳条件:

模型平稳的必要条件:\phi _1+\phi _2+...+\phi _p<1

模型平稳的充分条件:|\phi _1|+|\phi _2|+...+|\phi _p|<1

如果 \phi _1+\phi _2+...+\phi _p=1,说明至少有一个特征根等于1,模型不平稳。

3.2.3 平稳AR(p)模型的统计性质

(1) 均值

平稳序列均值为常数,即E(x_t)=\mu

由于E(x_t)=E(\phi _0+\phi _1x_{t-1}+...+\phi _{t-p}x_{t-p}+\varepsilon _t),E(\varepsilon _t)=0,易推得 :\mu=\frac{\phi _0}{1-\phi _1-\phi _2-...-\phi _p}

(2) 方差

需要借助Green函数的帮助。

Green函数的定义:

假设 {xt} 为任意p阶平稳时间序列,则一定存在常数序列 {Gj} 使得 {xt} 可以等价表示为纯随机序列\left \{ \varepsilon _t|\varepsilon _t\sim N(0,\sigma ^2)\right \} 的线性组合:

x_t=\phi _0+\phi _1x_{t-1}+...+\phi _px_{t-p}=G_0\varepsilon _t+G_1\varepsilon _{t-1}+G_2\varepsilon _{t-2}+...

AR(p) 的方差:

基于Green函数,可以求出 AR(p) 的方差为:

 Var(x_t)=(G_0^2+G_1^2+...)\sigma_\varepsilon ^2

a. AR(1)的方差:

x_t=\phi x_{t-1}+\varepsilon _t,故得到:

x_t=(1-\phi B)^{-1}\varepsilon _t=\varepsilon _t+\phi B\varepsilon _t+\phi ^2B^2\varepsilon _t+...=\varepsilon _t+\phi \varepsilon _{t-1}+\phi ^2\varepsilon _{t-2}+...,(当 |\phi |<1 时)

因此可以得出方差: 

Var(x_t)=Var(\varepsilon _t+\phi \varepsilon _{t-1}+\phi ^2\varepsilon _{t-2}+...)=\sum_{j=0}^{\infty }\phi ^{2j}\sigma _\varepsilon ^2=\frac{\sigma _\varepsilon ^2}{1-\phi ^2}

上式可以记作: x_t=G(B)\varepsilon _t 。

顺便可以推出:

Cov(x_t,x_{t-k})=Cov(\varepsilon_t +\phi \varepsilon _{t-1}+\phi^2 \varepsilon _{t-2}+...+\phi ^k\varepsilon _{t-k}+...,\varepsilon _{t-k}+\phi \varepsilon _{t-k-1}+...)=\phi ^k\frac{\sigma _\varepsilon ^2}{1-\phi ^2}

b. AR(2)的方差:

AR(2):y_t=\phi_1y_{t-1}+\phi _2 y_{t-2}+\varepsilon _t

得到 (1-\phi _1B-\phi _2B^2)y_t=\varepsilon _t,因为 1-\phi _1B-\phi _2B^2=(1-\lambda _1B)(1-\lambda _2B),故:

y_t=(1-\phi _1B-\phi _2B^2)^{-1}\varepsilon _t=\frac{1}{(1-\lambda _1B)(1-\lambda _2B)}\varepsilon _t

由一些数学知识知道,\lambda _1\neq \lambda _2 时:

\frac{1}{(1-\lambda _1B)(1-\lambda _2B)}=\frac{c_1}{1-\lambda _1B}+\frac{c_2}{1-\lambda _2B},(c_1=\frac{\lambda _1}{\lambda _1-\lambda _2},c_2=-\frac{\lambda _2}{\lambda _1-\lambda _2})

因此 ,

y_t=(\frac{c_1}{1-\lambda _1B}+\frac{c_2}{1-\lambda _2B})\varepsilon _t=(c_1+c_2)\varepsilon _t+(c_1\lambda _1+c_2\lambda _2)\varepsilon _{t-1}+(c_1\lambda _1^2+c_2\lambda _2^2)\varepsilon _{t-2}+...

Green 函数的递推公式:

由上面,我们现在已经推出了 \left\{\begin{matrix} \Phi(B)x_t=\varepsilon _t\\ x_t=G(B)\varepsilon _t \end{matrix}\right.,因此进一步得到 \Phi(B) G(B)\varepsilon _t=\varepsilon _t

因此可以据此用待定系数法求Gj :

 如AR(1)的Green函数递推公式就为 G_j=\left\{\begin{matrix} 1,j=0\\ \phi ^j,j=1,2,3,... \end{matrix}\right.

(3) 协方差

由于定义,我们知道 E(\varepsilon _tx_{t-k})=0

故而易得AR(p)的协方差 \gamma _k 的递推公式为:

E(x_tx_{t-k})=\phi _1E(x_{t-1}x_{t-k})+\phi _2E(x_{t-2}x_{t-k})+...+\phi _pE(x_{t-p}x_{t-k})+E(\varepsilon _tx_{t-k})

\gamma _k=\phi _1\gamma _{k-1}+\phi _2\gamma _{k-2}+...+\phi _p\gamma _{k-p}

(4) 自相关系数

\rho _k=\frac{\gamma _k}{\gamma _0},因此根据上面说到的协方差,可以直接得到自相关系数的递推公式:

\rho _k=\phi _1\rho _{k-1}+\phi _2\rho _{k-2}+...+\phi _p\rho _{k-p}

性质:

AR模型的自相关系数表达式(即上述递推公式)实际上是一个齐次差分方程,通解形式为:

\rho _k=\sum_{i=1}^{p}c_i \lambda _i^k,|\lambda _i|<1

根据其通解形式,可以判断AR模型具有呈指数衰减和拖尾性的特征。

a. 呈指数衰减

因为 |\lambda _i|<1 ,故 \rho _k\rightarrow 0 ,即自相关系数快速衰减到0附近。

b. 拖尾性

由于c1,c2,...,cp为任意常数,不会全为零, \rho _k 始终能取到非零值,即,自相关系数不会在k大于某个常数后恒等于零。这称作拖尾性。

(5) 偏自相关系数

自相关系数给出来的是 X_t,X_{t-k} 之间的总体相关性,但这两个变量有可能是都与 X_{t-1} 有关,因此出现的相关性,而并非二者之间的相关性。所以有必要引入偏自相关系数。

定义:在给定中间k-1个变量或者剔除中间t-1个变量影响的情况下,对 X_t,X_{t-k} 之间影响的相关度量。

\rho _{x_t,x_{t-k}|x_{t-1},...,x_{t-k-1}}=\frac{E[(x_t-\widehat{E}(x_t))(x_{t-k}-\widehat{E}(x_{t-k}))]}{E[(x_{t-k}-\widehat{E}(x_{t-k}))^2]}

其中,\widehat{E}x_t=E[x_t|x_{t-1},x_{t-2},...,x_{t-k}]

求偏自相关系数:

若 x_t=\phi _{k1}x_{t-1}+...+\phi _{k(k-1)}x_{t-k-1}+\phi _{kk}x_{t-k} (式1)

可以得到 \widehat{E}x_t=\phi _{k1}x_{t-1}+...\phi _{k(k-1)}x_{t-k-1}+\phi _{kk}\widehat{E}x_{t-k} (式2)

式1-式2 ,得到 E[(x_t-\widehat{E}(x_t))(x_{t-k}-\widehat{E}(x_{t-k}))]=\phi _{kk}E[(x_{t-k}-\widehat{E}(x_{t-k}))^2]

故 \rho _{x_t,x_{t-k}|x_{t-1},...,x_{t-k-1}}=\phi _{kk} 。

那么怎么求 \phi _{kk} 呢:通过Yule-walker方程!!

在方程 x_t=\phi _{k1}x_{t-1}+...+\phi _{k(k-1)}x_{t-k-1}+\phi _{kk}x_{t-k} 等号两边同时乘以 x_{t-l} ,再同时求期望并除以方差,得到:

\rho _l=\phi _{k1}\rho _{l-1}+...+\phi _{kk}\rho _{l-k},\forall l>0

 

   AR(1)模型的偏相关系数为 

性质:

p阶截尾性:即 \phi _{kk}=0,k>p 。

3.3 MA模型

3.3.1 定义

具有如下结构的称作q阶移动平均模型,记为MA(q):

\left\{\begin{matrix} x_t=\mu +\varepsilon _t-\theta _1 \varepsilon _{t-1}-...-\theta _q\varepsilon _{t-q}\\ \theta _q \neq 0 \\ E(\varepsilon _t)=0,Var(\varepsilon _t)=\sigma _\varepsilon ^2,E(\varepsilon _s\varepsilon _t)=0,(s\neq t) \end{matrix}\right.

尤其是当 \mu=0 时称作中心化q阶自回归模型。

引入延迟算子后q阶自回归模型又可以记作 x_t=\Theta (B)\varepsilon _t,其中,

\Theta (B)=1-\theta _1B-\theta _2B^2-...-\theta _qB^q

3.3.2 统计特征

(1) 均值

为常数。即 E(x_t)=\mu 。

(2) 方差

为常数。即 Var(x_t)=Var(\mu +\varepsilon _t-\theta _1 \varepsilon _{t-1}-...-\theta _q\varepsilon _{t-q})=(1+\theta _1^2+...+\theta _q^2)\sigma_\varepsilon ^2

(3) 自协方差函数q阶截尾

(4) 自相关系数q阶截尾

(5) 偏自相关系数 拖尾性

对于一个可逆的 MA(q) 模型,可以等价表示为 AR(\infty ) ,记作 I(B)x_t=\varepsilon _t ,其中:

\left\{\begin{matrix} I_0=1\\ I_j=\sum_{k=1}^{j}\theta _k'I_{j-k} \end{matrix}\right.,其中,\theta _k'=\left\{\begin{matrix} \theta _k,k\leq q\\ 0,k>q \end{matrix}\right.

因此,易知,由于AR模型偏自相关系数p阶截尾,故而MA模型 \infty 截尾,即具有偏自相关系数拖尾特性。

根据偏自相关系数的定义,不难知道延迟k阶的偏自相关系数为下面方程中的 \phi _{kk} :

\rho _j=\phi _{k1}\rho _{j-1}+...+\phi _{kk}\rho _{j-k}

对 j=1,2,...,k依次求方程,得到MA(1)模型 \phi _{kk}的通解为:

\phi _{kk}=\frac{-\theta _1^k}{\sum_{j=0}^{k}\theta _1^{2j}}

因为是拖尾,所以不管即使 k>q 也存在偏自相关系数。

3.3.3 MA模型的可逆性

不难发现不同的MA模型有时候具有相同的自相关系数,这导致拟合模型与随机序列之间不是一一对应的关系。

为了让给定的自相关函数具有唯一的模型,我们需要给它添加约束条件,即模型的可逆性条件。

一个自相关系数列唯一对应一个可逆MA模型。

(1) 可逆的MA模型定义:

若这个MA模型可以表示为收敛的AR模型,则称其为可逆的MA模型。

(2) MA模型可逆的条件:

与MA模型的平稳性是对偶性质。

当该模型的特征方程 \lambda ^q-\theta _1\lambda ^{q-1}-\theta _2\lambda ^{q-2}-...-\theta _q=0 的所有特征根绝对值均小于1,即:

|\lambda _i|<0,(i=1,2,...,q)

或者移动平滑系数多项式  \Theta (u)=0 的根绝对值都大于1,即 |u_i|=|1/\lambda _i|>1

举个例子:

可逆的MA(1)模型

(3) MA模型的可逆域

根据特征根绝对值均小于1的可逆条件,求出系数取值域。类似于AR模型求平稳域。

MA(1)的可逆域:\left \{ \theta |-1<\theta <1 \right \}

MA(2)的可逆域:\left \{ \theta _1,\theta _2||\theta _2|<1,\theta _1\pm \theta _2<1 \right \}

(4) 逆函数的递推公式

由上面所学,已知现在MA模型可以表示为两种方程,即\left\{\begin{matrix} x_t=\Theta (B)\varepsilon _t\\ I(B)x_t=\varepsilon _t \end{matrix}\right.,注意其中的 I 是逆函数,模型可以通过逆函数得到自身的逆转形式。

得到\Theta (B)I(B)x_t=x _t

因此,可以用待定系数法得到递推公式:

\left\{\begin{matrix} I_0=1\\ I_j=\sum_{k=1}^{j}\theta _k'I_{j-k} \end{matrix}\right.,其中,\theta _k'=\left\{\begin{matrix} \theta _k,k\leq q\\ 0,k>q \end{matrix}\right.

例子:

3.4 ARMA模型

3.4.1 定义

具有如下结构的模型称作自回归移动平均模型,简记为 ARMA(p,q):

\left\{\begin{matrix} x_t=\phi _0+\phi _1x_{t-1}+...+_px_{t-p}+\varepsilon _t-\theta_1 \varepsilon_{t-1}-...-\theta _q\varepsilon _{t-q} \\ \phi _p\neq 0,\theta _q\neq 0\\ E(\varepsilon _{t})=0,Var(\varepsilon _{t})=\sigma _\varepsilon ^2,E(\varepsilon _s\varepsilon _t)=0(s\neq t)\\ E(x_s\varepsilon _t)=0(s<t) \end{matrix}\right.

尤其,当 \phi _0=0 时,称作中心化ARMA模型。

传递形式:

x_t=\Phi ^{-1}(B)\Theta (B)\varepsilon _t=G_0\varepsilon _t+G_1\varepsilon _{t-1}+G_2\varepsilon _{t-2}+...,G0=1

逆传形式:

\varepsilon _t=\Theta ^{-1}(B)\Phi(B)x_t=I_0x_t+I_1x_{t-1}+I_2x_{t-2}+...,I0=1

3.4.2 平稳条件和可逆条件

平稳性完全由方程中的自回归部分的平稳性决定。

可逆性完全由方程中的移动平滑部分的可逆性决定。

3.4.3 统计性质

(1) 均值

E(x_t)=\frac{\phi _0}{1-\phi _1-\phi_2-...-\phi _p }

(2) 协方差函数

\gamma (k)=\sigma _\varepsilon ^2\sum_{i=0}^{\infty }G_iG_{i+k}

(3) 自相关系数

\rho _k=\frac{\gamma (k)}{\gamma (0)}=\frac{\sum_{i=0}^{\infty }G_iG_{i+k}}{\sum_{i=0}^{\infty }G_i^2}

ARMA模型自相关系数拖尾,偏自相关系数也拖尾。

相关性总结:

3.5 拟合与预测

3.5.1 建模步骤

3.5.2 单位根检验

(1) DF检验

假设序列确定性部分可以仅由过去1期表示,即 x_t=\phi x_{t-1}+\varepsilon _t 。

此时,显然仅有一个特征根 \lambda =\phi 。

提出假设:原假设为序列非平稳,即  H_0:|\phi |\geq 1 。

探寻 |\phi | 的分布:经过前人辛苦实验,我们找到了|\phi | 的渐进分布

a. 当 |\phi |<1 时,\tau (\phi )=\frac{\widehat{\phi }-\phi }{S(\widehat{\phi })}\rightarrow N(0,1)

b. 当 |\phi |=1 时,\tau =\frac{|\widehat{\phi |}-1}{S(\widehat{\phi })}

令 \rho =|\phi |-1,则原假设可以等价表示为 H_0:\rho = 0 。将模型改写为 \bigtriangleup x_t=\rho x_{t-1}+\varepsilon _t 。

构造统计量:

\tau =\frac{\widehat{\rho} }{S(\widehat{\rho })}

给定显著性水平,查表得到分位点为 \tau _\alpha,若 \tau <\tau _\alpha,拒绝原假设,认为序列平稳;反之认为序列不平稳。

DF检验有三种类型,上述是对第一种类型的检验,另外两种类似,只是模型改写后的式子稍有差异(多了趋势项或者漂移项)

 只要一个类型的DF检验通过了就说明该序列是平稳的。

例子:对{ln yt} 序列进行DF检验

 不论考虑哪种类型,单位根检验的p值均大于显著性水平,因此序列显著非平稳。

(2) ADF检验

假设序列可以由p期历史序列表示,和DF检验一样有三种类型:

假设有一个特征根 \lambda =1,代入特征方程,得到:

1-\phi _1-...-\phi _p=0\rightarrow \phi _1+\phi _2+...+\phi _p=1

令 \rho =\phi _1+\phi _2+...+\phi _p-1

提出假设:原假设为序列是非平稳序列,即 H_0:\rho =0

构造统计量:

\tau =\frac{\widehat{\rho} }{S(\widehat{\rho })}

例子:对序列 {xt} 进行ADF检验

由于有一个类型的一个单位根检验对应p值小于显著性水平,因此序列在拟合AR(2)模型后,残差序列平稳。

3.5.3 模型识别

(1) 样本自相关系数

(2) 样本偏自相关系数

按照两类系数的拖尾性、截尾性即可。

3.5.4 参数估计

(1) 矩估计

(2) 极大似然估计

(3) 最小二乘估计

3.5.5 模型检验

(1) 模型显著性检验

检验拟合模型的有效性,即检验残差序列是否为白噪声序列,如果是,则说明信息提取充分。

(2) 参数显著性检验

3.5.6 模型预测

最小均方误差原则

4. 非平稳序列的确定性分析

4.1 确定性因素分析

目的:客服其他因素影响,单独测量出某一个因素对时间序列的影响。以及,推断出各因素之间的相互影响以及对序列的综合影响。

认为所有的序列波动均可以归纳为受到四大因素影响:

(1) 长期趋势因素

较长时间内的发展方向,可以表现为较长时间内持续向上、向下或是保持平稳的趋势。

(2) 季节变动因素

一种长度或者幅度固定的周期波动。

(3) 循环波动

呈现出一种从低到高再从高到低的反复循环波动,周期可长可短,不固定。

(4) 不规则变动因素

又称随机变动,来自于各种偶然因素。

假定时间序列会受到以上四个因素中部分或全部的影响,则时间序列可以表示为这四个因素的函数。

加法模型:x_t=T_t+S_t+C_t+I_t

乘法模型:x_t=T_t\times S_t\times C_t\times I_t

伪加法模型:x_t=T_t\times (S_t+C_t+I_t-1)

对数加法模型:ln x_t=lnT_t+ln S_t+lnC_t+lnI_t

4.2 趋势分析

有些序列中有着非常显著的趋势,而趋势分析的目的则是找出这些趋势,并利用这种趋势对序列未来发展做出推测。

4.2.1 趋势拟合法

将时间作为自变量,序列值作为因变量进行回归。

(1) 线性拟合

\left\{\begin{matrix} x_t=a+bt+I_t\\ E(I_t)=0,Var(I_t)=\sigma ^2 \end{matrix}\right.

可以用OLS法估计参数。

(2) 非线性拟合

当长期趋势呈现出非线性特征时我们考虑这个方法。

能转换呈线性模型在转换后的使用OLS估计参数,不能转换的使用迭代法估计参数。

4.2.2 平滑法

采用修匀技术,削弱短期随机波动对序列的影响,平滑化序列。

(1) 移动平均法

思想:假如在一个短期间隔中,序列波动主要由随机因素影响,因此,可以使用一段时间间隔内的平均值作为某个时期的估计值。

a. n期中心移动平均

\widetilde{x_t}=\left\{\begin{matrix} \frac{1}{n}(x_{t-\frac{n-1}{2}}+x_{t-\frac{n-1}{2}+1}+...+x_t+...x_{t+\frac{n-1}{2}-1}+x_{t+\frac{n-1}{2}}),n is odd\\ \frac{1}{n}(x_{t-\frac{n}{2}}+x_{t-\frac{n}{2}+1}+...+x_t+...x_{t+\frac{n}{2}-1}+x_{t+\frac{n}{2}}),n is even \end{matrix}\right.

b. n期移动平均

\widetilde{x_t}=\frac{1}{n}(x_{t-n+1}+x_{t-n+1}+...+x_t)

移动平均期数的确定:如果序列有周期,则以周期长度为间隔长度,为了消除周期效应影响。期数越多,序列越平滑,反之越敏感。

移动平均预测:

\widehat{x}_{t+l}=\frac{1}{n}(x_{t+l-1}'+x_{t+l-2}'+...+x_{t+l-n}'),如 \widehat{x}_{t+1} 是一期预测,\widehat{x}_{t+2}是二期预测,要进行二期预测需要先进行一期预测。

其中,x_{t+l-i}'=\left\{\begin{matrix} \widehat{x}_{t+l-i},i<1\\ x_{t+l-i},i\geq 1 \end{matrix}\right.

(2) 指数平滑法

生活中,通常是近期发生的事情对未来的影响较远期发生过的事情更大,而移动平均法中各期权重均相同(均为1/n),因此存在一定问题。

简单指数平滑模型:

\widehat{x}_t=\alpha x_{t}+\alpha (1-\alpha )x_{t-1}+\alpha (1-\alpha )^2x_{t-2}+...

等价公式:

\widehat{x}_t=\alpha x_t+(1-\alpha )\widehat{x}_{t-1}

不过简单指数平滑法需要确定初始值,常常指定 \widehat{x}_1=x_1。变化缓慢的序列,α较小,反之较大。

简单指数平滑预测:

一期预测:\widehat{x}_{t+1}=\alpha x_t+\alpha(1-\alpha)x_{t-1}+...

二期预测:\widehat{x}_{t+2}=\alpha\widehat{x}_{t+1}+\alpha(1-\alpha)x_t+\alpha (1-\alpha)^2x_{t-1}+...=\alpha\widehat{x}_{t+1}+\alpha(1-\alpha)\widehat{x}_{t+1}=\widehat{x}_{t+1}

用此方法预测任意1期的预测值均为常数。

4.3 季节效应分析

5. 非平稳序列的随机分析

5.1 差分运算

5.1.2 差分的类型

(1) p阶差分

\bigtriangledown ^px_t=(1-B)^px_t=\sum_{i=0}^{p}(-1)^iC_{p}^{i}\textrm{x}_{t-i}

(2) k步差分

\bigtriangledown _kx_t=(1-B^k)x_t=x_t-x_{t-k}

5.1.2 Cramer分解定理

任何一个时间序列均可分解为一个由多项式决定的确定性趋势和一个平稳误差项之和,即:

x_t=\mu_t+\varepsilon _t=\sum_{j=1}^{d}\beta _jt^j+\Psi (B)a_t

其中,d<\infty ,\beta_i 为常数系数,{at}为均值为0的白噪声序列,\Psi (B) 为算子多项式。

这个定理在理论上保证了适当的差分一定可以充分地提取序列中的确定性信息。类似于函数中的求导运算,若确定性趋势是时间的d阶多项式,则d阶差分后的确定性趋势就是常数,与时间无关,从而实现序列的平稳化。如下:

\bigtriangledown ^d(\sum_{j=0}^{d}\beta _jt^j)=k,(k为常数)

因此,理论上,任何非平稳序列都可以通过适当差分运算转化为平稳序列。

5.1.3 差分方式的选择

(1) 序列如果有着较显著的线性趋势,通常选择一阶差分;

(2) 序列如果有曲线趋势,那么选择低阶差分即可(二、三阶);

(3) 序列如果存在固定周期,那么取其周期长度为差分步长以提取周期信息。

5.1.4 需要注意的事项

(1) 过差分

即已经利用差分运算充分提取序列趋势之后继续差分,这会浪费有效信息,使得序列方差变大,参数估计的精度下降。

(2) 当序列含有可线性化的趋势时,最好先把可线性化的趋势线性化之后再差分,这样差分的阶数会小一些,信息损失少。

5.2 ARIMA模型

若序列可以通过d阶差分转换为平稳序列,并可以拟合一个平稳可逆的ARMA模型时,则等价于序列可以拟合如下模型:

\Phi (B)\bigtriangledown ^dx_t=\Theta (B)\varepsilon _t

5.2.1 ARIMA模型的结构

具有如下形式的称作求和自回归移动平均模型,记作ARIMA(p,d,q):

\left\{\begin{matrix} \Phi (B)\bigtriangledown ^dx_t=\Theta (B)\varepsilon _t\\ E(\varepsilon _t)=0,Var(\varepsilon _t)=\sigma _\varepsilon ^2,E(\varepsilon _s\varepsilon _t)=0,(s\neq t)\\ E(x_s\varepsilon _t)=0,(s<t) \end{matrix}\right.

5.2.2 ARIMA模型族

(1) d=0时,是ARMA(p,q)模型;

(2) p=0时,是IMA(d,q)模型;

(3) q=0时,是ARI(p,d)模型;

(4) p=q=0,d=1时,是随机游走模型(random walk model)

     即,x_t=x_{t-1}+\varepsilon _t

5.2.3 ARIMA模型的性质

(1) 平稳性

模型共有p+d个特征根,p个的绝对值小于1(在单位圆内),d个的绝对值等于1(在单位圆上)。当 d\neq 0 时,模型非平稳。

(2) 方差齐性

当 d\neq 0 ,原序列方差非齐性。d阶差分后序列方差齐性。

5.2.4 ARIMA模型建模过程

5.2.5 ARIMA模型的预测

原理:最小均方误差准则

(1) 最小均方误差预测原理

已知ARIMA模型一般可以表示为: \Phi (B)(1-B)^dx_t=\Theta (B)\varepsilon _t

可以将xt 表示成关于随机扰动项的线性函数 ,即 x_t=\varepsilon _t+\psi_1 \varepsilon _{t-1}+\psi _2\varepsilon _{t-2}+...=\Psi (B)\varepsilon _t 。

式子里面扰动项前面的系数可以通过待定系数法求得,因为\Phi (B)(1-B)^d\Psi (B)\varepsilon _t=\Theta (B)\varepsilon _t,故而:

\widetilde{\phi }_i为广义自回归系数。

当我们想要向前进行l 期预测时,先写出 x_{t+l} 的真实值表达式如下:

x_{t+l}=(\varepsilon _{t+l}+\psi _1\varepsilon _{t+l-1}+...+\psi _{l-1}\varepsilon _{t+1})+(\psi _t\varepsilon _t+\psi _{t-1}\varepsilon _{t-1}+...)

因为显然 \varepsilon _{t+1},\varepsilon _{t+2},...,\varepsilon _{t+l} 不可得,因此 x_{t+l} 的预测值为 \widehat{x}_t(l)=C_0\varepsilon _t+C_1\varepsilon _{t-1}+...

用最小均方误差确定C0,C1,C2...的值。

a. 计算预测误差 e_t(l)

即真实值减去预测值:e_t(l)=(x_{t+l}-\widehat{x}_t(l)=\varepsilon _{t+l}+\psi _1\varepsilon _{t+l-1}+...+\psi _{l-1}\varepsilon _{t+1})+(\psi _l-C_0)\varepsilon _t+(\psi _{t+1}-C_1)\varepsilon _{t-1}+...

因此可以得到预测误差的方差为 Var(e_t(l))=(1+\psi _1^2+\psi _2^2+...+\psi _{l-1}^2)\sigma _\varepsilon ^2+\sum_{j=0}^{\infty }(\psi _{l+j}-C_j)^2\sigma _\varepsilon ^2

b. 利用最小均方误差确定C0,C1,C2...的值

要使得均方误差最小,当且仅当 \psi _{l+j}-C_j=0,因此,向前预测 l 期时,预测值为:

\widehat{x}_t(l)=\psi _l\varepsilon _t+\psi _{l+1}\varepsilon _{t-1}+...

对应的误差的方差为 Var(e_t(l))=(1+\psi _1^2+...+\psi _{l-1}^2)\sigma _\varepsilon ^2

(2) 条件期望预测

x_{t+l} 关于 x_t,x_{t-1},...的条件期望为:

E(x_{t+l}|x_t,x_{t-1},x_{t-2},...)=E((\varepsilon _{t+l}+\psi _1\varepsilon _{t+l-1}+...+\psi _{l-1}\varepsilon _{t+1})+(\psi _t\varepsilon _t+\psi _{t-1}\varepsilon _{t-1}+...)|x_t,x_{t-1},...)=\psi _t\varepsilon _t+\psi _{t-1}\varepsilon _{t-1}+...

因此,条件期望预测与最小均值误差预测等价。

例子:

5.2.6 ARIMA疏导模型

我们已知ARIMA(p,d,q)模型就是d阶差分过后自回归最高阶数为p,移动平均最高阶数为q的模型,通常应包括p+q个未知系数。但是若有部分系数为0,即有部分系数缺省,则称该模型为疏导模型。

比如自回归系数和移动平滑部分均有缺省的话可以记作:

ARIMA((p_1,p_2...p_m),d,(q_1,q_2...q_n))

5.2.7 简单季节模型

指序列中的季节效应和其他效应是加法关系,如下:

x_t=T_t+S_t+I _t

通过简单的趋势差分和季节差分之后序列即可转化为平稳序列,模型结构如下:

\bigtriangledown _D\bigtriangledown ^dx_t=\frac{\Theta (B)}{\Phi (B)}\varepsilon _t

ARIMA模型也可以用来对这类具有季节效应的序列进行建模,称ARIMA加法模型,记作ARIMA(p,(D,d),q) 。

其中,D指进行D步差分,d指进行d阶差分。

5.2.8 乘积季节模型

短期相关性用ARMA(p,q)提取,季节相关性用周期步长为S的ARMA(P,Q)模型提取。

模型记作:

\bigtriangledown ^d\bigtriangledown _S^Dx_t=\frac{\Theta (B)}{\Phi (B)}\frac{\Theta _S(B)}{\Phi _S(B)}\varepsilon _t

即,d阶差分后拟合ARMA(p,q)模型,D阶差分、S步差分之后拟合ARMA(P,Q)模型。

注意:

简记该乘积模型为 ARIMA(p,d,q)\times(P,D,Q)_S

例子:

5.3 Auto-Regressive 模型

ARIMA模型虽然可以对非平稳时间序列建模,但是有着一定缺陷,如差分运算会损失信息,经济意义不强,常常无法对模型进行直观解释。

因此,在这基础之上又提出残差自回归模型。

5.3.1 模型定义

通过确定性因素分析提取出序列中主要的确定性信息:

x_t=T_t+S_t+\varepsilon _t

通过对残差序列进行自相关性检验,从而检验模型的有效性。

若残差自相关性不显著,说明序列中的确定性因素已经提取充分,否则说明提取不够充分,可以考虑对残差序列拟合自回归模型。

因此,将下述模型定义为残差自回归模型:

\left\{\begin{matrix} x_t=T_t+S_t+\varepsilon _t\\ \varepsilon _t=\phi _1\varepsilon _{t-1}+\phi _2\varepsilon_{t-2}+...+\phi _p\varepsilon _{t-p}+a_t\\ E(a_t)=0,Var(a_t)=\sigma ^2,Cov(a_t,a_{t-i})=0(i\geq 1) \end{matrix}\right.

其中,

(1) 对趋势效应 Tt 常用的拟合方法

多项式回归模型:T_t=\beta _0+\beta _1t+\beta _2t^2+...+\beta _kj^k+\varepsilon _t

关于历史序列值建模:T_t=\beta _0+\beta _1x_{t-1}+\beta _2x_{t-2}+...+\beta _kx_{t-k}+\varepsilon _t

(2) 对季节效应 St 常用的拟合方法

给定季节指数:S_t=S_t'  ,这里St‘指的是已知的季节指数。

建立季节自回归模型:S_t=\alpha _0+\alpha _1x_{t-m}+...+\alpha _px_{t-mp},m为固定周期。

5.3.2 检验残差序列自相关性

假如已经得到 x_t=T_t+S_t+\varepsilon _t ,回归之后,检验其残差是否存在一阶相关性。可以考虑用DW检验,但DW统计量有颇多限制(参考计量经济学笔记中自相关性章节)。

当解释变量中存在滞后因变量时,不可以用DW统计量,但是可以考虑使用Durbin h统计量。

Dh=DW\frac{n}{1-n\sigma _\beta ^2}\sigma _\beta ^2为该滞后因变量系数最小二乘估计的方差。

提出假设:原假设 H_0:\rho =0

大样本下,原假设成立时,Dh统计量服从标准正态分布。因此给定显著性水平α时,查表得到标准正态分布大小Z_{\alpha /2} 。

当 |Dh|>Z_{\alpha/2} 时,拒绝原假设,认为存在一阶自相关。

5.3.3 拟合残差序列

(1) 绘制残差自相关图和偏自相关图确定阶数。

若原序列拟合的模型为 x_t=T_t+\varepsilon _t,则可以得到 \varepsilon _t=x_t-T_t 。

(2) 参数估计方法:极大似然估计

(3) 模型检验

6. 多元时间序列分析

6.1 平稳多元时间序列建模

即ARIMAX模型,其结构如下:

\left\{\begin{matrix} y_t=\mu +\sum_{i=1}^{k}\frac{\Theta _i(B)}{\Phi _i(B)}x_{it}+\varepsilon _t\\ \varepsilon _t=\frac{\Theta (B)}{\Phi (B)}a_t \end{matrix}\right.

{xt}为输入序列,{yt}为输出序列,均为时间序列,可以分别拟合ARMA模型。上述是yt与xt之间的关系。

举个例子:

以天然气输入速率为输入序列,以CO2的输出浓度为输出序列,建立ARIMAX模型。

如果对输入输出序列分别建立ARMA模型(即一元分析),则可以得到:

因为除了时间外,输入序列也对输出序列有影响,不妨进行多元分析,即拟合ARIMAX模型:

最后我们对比一元模型和多元模型的AIC和SBC值,会发现多元模型显然拟合得更好,因为考虑了更多有关信息。

6.2 虚假回归

经实验,我们发现在非平稳场合,参数显著性检验犯拒真错误的概率远大于给定的显著性水平α(即α即拒真概率)。因此当参数不显著时,我们常常会在参数显著性检验里得到相反的错误结论,导致产生伪回归。

6.3 单位根检验

由上面可知由于虚假回归的存在,我们最好先检验序列平稳性,在其平稳的基础上再进行建模。

单位根检验其实就是通过检验特征根在单位圆外还是圆上来检验序列的平稳性,常用的有DF、ADF、PP等。

ADF主要用于方差齐性情况下的检验,对异方差情况下的平稳性检验效果不好;而PP检验主要应用于异方差场合下的单位根检验。

6.4 协整

6.4.1 单整

如果序列平稳,则说明序列不存在单位根,称作0阶单整序列,简记为 x_t\sim I(0)

如果序列需要d阶差分之后才平稳,则说明序列至少含有d个单位根,称作d阶单整序列 ,简记为x_t\sim I(d)

6.4.2 协整

如果以时间序列{yt}为响应变量,时间序列{x1},{x2},...,{xk}为自变量,构建回归模型。如果回归的残差序列是平稳的,则说明自变量和响应变量之间是协整的,具有协整关系。

6.4.3 协整检验

我们通常用EG检验,也称ED两步法。第一步进行回归,第二步是检验残差序列平稳性。

原假设:多元非平稳序列之间不存在协整性;

备择假设:多元非平稳序列之间存在协整性;

等价于

原假设:回归残差序列非平稳,即 \left \{ \varepsilon _t \right \}\sim I(0)

备择假设:回归残差序列平稳,即  \left \{ \varepsilon _t \right \}\sim I(k),(k\geq 1)

6.4.4 建模

在检验完协整关系后,如果残差序列平稳,可以进一步检验它是否为纯随机序列,如果不是,则可以绘制它的自相关图和偏自相关图,用以拟合ARMA模型。

最后呈现的模型结构为:

y_t=\beta _0+\beta _1x_t+\Phi (B)\Theta (B)a_t

其中,{at}为随机波动,有  \varepsilon _t=\Phi (B)\Theta (B)a_t 。

6.5 误差修正模型 ECM

常作为协整回归模型的补充模型出现。

协整回归模型度量序列之间的长期相关关系,而误差修正模型则可以解释序列之间的短期波动。

响应变量当期波动主要受三方面影响:

(1) 当期自变量序列的波动

(2) 上期的误差

(3) 纯随机波动

如下:

y_t-y_{t-1}=\beta x_t-\beta x_{t-1}-\varepsilon _{t-1}+\varepsilon _t

\bigtriangledown y_t=\beta \bigtriangledown x_t+ECM_{t-1}+\varepsilon _t

因此,引出模型结构为:

\bigtriangledown y_t=\beta \bigtriangledown x_t+\beta _1ECM_{t-1}+\varepsilon _t

注意其中的负反馈机制\beta <0

即上期自变量真实值比估计值大的话,反馈回来,会消减当期的波动幅度。

  • 13
    点赞
  • 93
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值