一.引言
学习建模这么久以来,很多模型都是进行实践的过程中学习的,更加重视了结果,很多原理都看不懂,说实话压力还是很大的,第一次参加比赛还是很慌张,这一讲的补充内容老师说是了解即可,但是我还是想努力看明白。还有半个月,加油吧!!
二.一元时间序列分析的模型
- 平稳时间序列和白噪声序列
- 差分方程和滞后算子
- AR模型
- MA模型
- ARMA模型
- ACF和PACF
- ARMA模型的估计
- AIC和BIC准则
- ARIMA模型
- SARIMA模型
三.平稳性(stationary series)
1.弱平稳
2.严格平稳
3.白噪声
4.例子
说实话,有几个图看不明白,老师说他也觉得存在问题,只是借这个理解一下
四.差分方程
将某个时间序列变量表示为该变量的滞后项、时间和其他变量的函数,这样的一个函数方程被称为差分方程
差分方程的齐次部分:只包含该变量自身和它的滞后项的式子。
五.滞后算子
六.模型
1.AR§模型(auto regressive)
【1】概述
自回归只能适用于预测与自身前期相关的经济现象,即受自身历史因素影响较大的经济现象,如矿的开采量,各种自然资源产量等。
对于受社会因素影响较大的经济现象,不宜采用自回归,而应使用可纳入其他变量的向量自回归模型(多元时间序列)。
注意:
我们讨论的AR§模型一定是平稳的时间序列模型,如果原数据不平稳也要先转换为平稳的数据才能再进行建模。
【2】 A R ( p ) AR(p) AR(p)模型平稳的条件
【3】举个小例子
先求特征方程,然后求解,然后算出模长,根据规则破判断是否稳定,发现有两个小于1,一个等于1,那么进行一阶差分变形
发现和上面的解一样而且都小于1了,稳定
所以进行一阶差分变形就稳定
2.MA(q)模型(moving average)
【1】模型概述
【2】MA模型和AR模型的关系
我们可以将1阶移动平均模型转换为无穷阶的自回归模型,这一性质称为移动平均模型的可逆性;类似的,我们在某些条件下(可逆性条件)也可以将MA(q)模型也转换为无穷阶的自回归过程。
一般地,任何经济变量的时间序列都可以自回归过程来描述。但在模型分析的实
践中,为简化估计参数的工作量,我们当然希望模型当中的参数尽可能地少。于是便有了引进移动平均过程MA(q)的必要
【3】MA(q)模型的平稳性
3.ARMA(p,q)模型
【1】概述
自回归移动平均模型(Autoregressive Moving Average,ARMA),就是设法将自回归过程AR和移动平均过程MA结合起来,共同模拟产生既有时间序列样本数据的那个随机过程的模型。
【2】ARMA(p,q)模型的平稳性
一般,我们可以通过观察时序图来判断时间序列是否平稳,当然,也有相应的
假设检验方法能帮助我们对数据的平稳性进行检验(由于第三种情况几乎不会发生,因此我们只需要检验时间序列是单位根还是平稳的即可)
4.ARIMA(p,d,q)模型
【1】概述
差分自回归移动平均模型
(Autoregressive Integrated Moving Average Model)
【2】模型
【3】ARIMA(1,1,1)时间序列图
5.SARIMA(Seasonal ARIMA)模型
【1】概述
【2】模型
七.参数pq确定方法
1.ACF自相关系数
2.PACF偏自相关函数
3.例子
AR(1)模型(系数符号相反)
MA(1)和AR(2)模型
ARMA(1,1)模型
总结
例子:
图1和图2上均有两条蓝色的线,其表示假设检验对应的上下临界值,如果自相关系数或偏自相关系数位于这两条线内,则认为它们与0没有显著的差异。
H0:ps=0
分析:
序列x的样本自相关系数在第1,3,5,14阶显著的异于0,且从图形上来看表现出拖尾的特性;而样本偏自相关系数只有第1,3两阶显著的异于0,超过3阶后均和0没有显著的差异,这说明序列x的偏自相关函数在3阶后截尾;综上,我们认为序列x可由AR(3)生成。
分析:
序列x的样本偏自相关系数在第1,2,7,9,16阶显著的异于0,且从图形上来看表现出拖尾的特性;而样本自相关系数只有第1,2两阶显著的异于0,超过2阶后均和0没有显著的差异,这说明序列x的自相关函数在2阶后截尾;综上,我们认为序列x可由MA(2)生成
4.模型选择:AIC和BIC准则(选小原则)
过拟合问题:加入的参数个数越多,模型拟合的效果越好,但这却是以提高模型复杂度为代价的。因此,模型选择要在模型复杂度与模型对数据的解释能力之间寻求最佳平衡。
这个方法其实就是解决过拟合问题,选择合适的参数达到最优pq
AIC和BIC是选小原则,我们要选择使得AIC或BIC最小的模型。
(BIC对于模型的复杂程度的惩罚系数更大,因此BIC往往比AIC选择的模型更简洁)
八.检验模型是否识别完全
1.概述
估计完成时间序列模型后,我们需要对残差进行白噪声检验,如果残差是白噪声,则说明我们选取的模型能完全识别出时间序列数据的规律,即模型可接受;如果残差不是白噪声,则说明还有部分信息没有被模型所识别,我们需要修正模型来识别这一部分的信息。
2.白噪声
(是否完全识别就是检验残差是否为白噪声)
3.Q检验
Q检验能帮助我们检验残差是否为白噪声: