目录
一、时间序列的组合成分
时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响1。其中:
- 长期趋势因素(T)反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。
- 季节变动因素(S)是经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。
- 周期变动因素(C)也称循环变动因素,它是受各种经济因素影响形成的上下起伏不定的波动。
- 不规则变动因素(I)不规则变动又称随机变动,它是受各种偶然因素影响所形成的不规则变动。
二、常用时序算法及适应范围
三、拖尾和截尾
拖尾:始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)
截尾:在大于某个常数k后快速趋于0为k阶截尾
四、ARIMA模型的分类
表示随机过程的ARIMA模型一般分为4种类型2:
- 自回归(AR)模型
- 移动平均(MA)模型
- 自回归移动平均(ARMA)模型
- 单整自回归移动平均(ARIMA)模型
4类ARIMA过程以及白噪声过程、随机游走过程都是以过程的期望等于零为前提的。当随机过程的期望不等于零时,可以转化为零均值过程进行研究。
4.1 自回归模型
**定义:**如果一个线性随机过程可表达为:
x
t
=
ϕ
1
x
t
−
1
+
ϕ
2
x
t
−
2
+
⋅
⋅
⋅
+
ϕ
p
x
t
−
p
+
μ
t
x_t=\phi_1x_{t-1}+\phi_2 x_{t-2} + ··· +\phi_p x_{t-p}+\mu_t
xt=ϕ1xt−1+ϕ2xt−2+⋅⋅⋅+ϕpxt−p+μt,
其中
ϕ
i
,
i
=
1
,
⋅
⋅
⋅
,
p
\phi_i,i=1,···,p
ϕi,i=1,⋅⋅⋅,p是自回归系数,
μ
t
\mu_t
μt是白噪声过程,则这个线性过程
x
t
x_t
xt称为
p
p
p阶自回归过程,用
A
R
(
p
)
AR(p)
AR(p)表示。
- 对于 A R ( p ) AR(p) AR(p)过程只需考虑平稳性问题,条件是 Φ ( L ) = 0 \Phi(L)=0 Φ(L)=0的根(绝对值)必须大于1。不必考虑可逆性问题。
4.2 移动平均模型
**定义:**如果一个线性随机过程可表达为:
x
t
=
μ
t
+
θ
1
μ
t
−
1
+
θ
2
μ
t
−
2
+
⋅
⋅
⋅
+
θ
q
μ
t
−
q
x_t=\mu_t+\theta_1 \mu_{t-1}+\theta_2 \mu_{t-2}+···+\theta_q \mu_{t-q}
xt=μt+θ1μt−1+θ2μt−2+⋅⋅⋅+θqμt−q,
其中
θ
1
,
θ
2
,
⋅
⋅
⋅
,
θ
q
\theta_1,\theta_2,···,\theta_q
θ1,θ2,⋅⋅⋅,θq是移动平均系数,
μ
t
\mu_t
μt是白噪声过程,则称上式为
q
q
q阶移动平均过程,记为
M
A
(
q
)
MA(q)
MA(q)
- 对于有限阶 M A ( q ) MA(q) MA(q)过程,只需考虑可逆性问题,条件是 Θ ( L ) = 0 \Theta(L)=0 Θ(L)=0的根必须位于单位圆之外,不必考虑平稳性问题。
4.3 自回归移动平均模型
**定义:**由自回归和移动平均两部分共同构造的随机过程称为自回归移动平均过程,记为
A
R
M
A
(
p
,
q
)
ARMA(p,q)
ARMA(p,q),其中
p
,
q
p,q
p,q分别表示自回归和移动平均部分的最大滞后阶数。
A
R
M
A
(
p
,
q
)
ARMA(p,q)
ARMA(p,q)的一般表达式是:
x
t
=
ϕ
1
x
t
−
1
+
ϕ
2
x
t
−
2
+
⋅
⋅
⋅
+
ϕ
p
x
t
−
p
+
μ
t
+
θ
1
μ
t
−
1
+
θ
2
μ
t
−
2
+
⋅
⋅
⋅
+
θ
q
μ
t
−
q
x_t=\phi_1x_{t-1}+\phi_2 x_{t-2} + ··· +\phi_p x_{t-p}+\mu_t+\theta_1 \mu_{t-1}+\theta_2 \mu_{t-2}+···+\theta_q \mu_{t-q}
xt=ϕ1xt−1+ϕ2xt−2+⋅⋅⋅+ϕpxt−p+μt+θ1μt−1+θ2μt−2+⋅⋅⋅+θqμt−q
- A R M A ( p , q ) ARMA(p,q) ARMA(p,q)过程的平稳性只依赖于其自回归部分,即 Φ ( L ) = 0 \Phi(L)=0 Φ(L)=0的全部根的值在单位圆之外。其可逆性只依赖于移动平均部分,即 Θ ( L ) = 0 \Theta(L)=0 Θ(L)=0的根的值应在单位圆之外。
4.4 单整自回归移动平均模型
针对含有单位根的非平稳随机过程,假设一个随机过程含有 d d d个单位根,则其经过 d d d次差分之后可以变换成为一个平稳的自回归移动平均过程。("单整”就是积分的意思),记为 A R I M A ( p , d , q ) ARIMA(p,d,q) ARIMA(p,d,q)。
- 对于非季节经济时间序列, p , d , q p,d,q p,d,q的值很少有大于2的情形。这些参数的常见取值是0,1。
五、ARIMA模型的建立、估计过程与预测
建立时间序列模型的步骤
![](https://i-blog.csdnimg.cn/blog_migrate/f4432f7f8e545df29a065720ec2c6a71.png)
5.1 模型识别
- 首先要确定d,即判断序列的平稳性
- 第2步是在平稳时间序列基础上识别ARMA模型阶数p, q
判断序列平稳的方法有两种:
- 观察序列的相关图
- 采用单位根检验方法
判断序列平稳过程中的3点注意事项:
- 如果序列存在异方差,应该先对序列取自然对数,然后用经过自然对数变换的序列建立ARIMA模型
- 防止过度差分,即防止在已经是平稳序列的基础上再次进行差分。判断序列是否差分过度的方法是观察序列的方差。若序列经过差分后方差变大,则说明差分次数过多。
- 若一个有限时间序列的相关图呈近似线性衰减,说明是一个非平稳序列(若相关图呈指数函数或正弦函数衰减,则说明是一个平稳序列)
5.1.1 自相关和偏自相关函数的特征
- 当得到一个时间序列后,如何判断其是属于何种类型的模型呢?要依靠对该序列的自相关函数和偏自相关函数的分析。
5.1.2 根据自相关函数偏自相关函数识别p,q
- 一个随机过程的自相关函数通常是未知的。相关图是对自相关函数的估计。由于MA国产和ARMA过程中的MA分量的自相关函数具有截尾特性,所以通过相关图可以估计MA过程的阶数q。
- 偏自相关函数在滞后期p以后有截尾特性,因此可用此性质识别AR§过程的阶数。
5.1.3 ARIMA过程与其自相关函数偏自相关函数特征
![](https://i-blog.csdnimg.cn/blog_migrate/2da3c025ecf067b53578dc6db4c3fea0.png)
![](https://i-blog.csdnimg.cn/blog_migrate/0b4a009cc1b0805ac44123d3e96e324e.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6f6e263077b3d3a34fbc386477f842b1.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6cf3443549b0d6fba1cbf15ebc9539ba.png)
![](https://i-blog.csdnimg.cn/blog_migrate/c18616bde8be556a8b949ee12fdce374.png)
5.2 模型参数的估计
极大似然法MLE
5.3 模型的诊断与检验
需要做的诊断是:
- 检验模型系数估计值是否显著性地不等于0
- 检验残差序列的白噪声性
- 观察特征根的位置是否在单位圆以外
对应的检验方法:
- 系数估计值的显著性检验通过t统计量**(t检验)**来完成
- 模型拟合的优劣以及残差序列白噪声性的检验是用Ljung和Box提出的Q统计量完成**(Q检验)**
实际中,对于非季节时间序列,一般从检验Q(1)~Q(15)就可以了。
5.4 模型的预测
ARIMA模型做样本外短期预测效果很好。实际中预测期k最好不要大于模型参数p+q。
预测并不能消除未来时期的高度不确定性。预测的最大价值在于向决策者提供了如果按过去和现在的变化规律发展下去或假定了某些变化的前提下时间序列将会导致何种结果。对预测的过低评价或过高期待都是有失偏颇的。