一、三大模型引入
① AR(p)模型:这个又叫做自相关模型,为什么叫自相关,初学者可能不太好理解。事实上它就是在衡量不同期的序列值之间的相关性。从模型上很容易看出来:以AR(1)为例:
可以发现AR(1)就是在比较第t期序列值和第(t-1)期序列值的关系,他们之间的关系强度用a1可以进行衡量。
② MA(q)模型:这个又叫做滑动平均模型,事实上就是在衡量本期的差值与前期的差值之间的关系,可以发现MA(1)就是在第t期的序列值的预测等于本期的误差-之前的误差。
③ ARMA(p,q)模型:这个模型就是AR和MA的大杂烩了。
二、三大模型各自的性质
① AR(p)模型:
AR模型具有的特点就是它能够很好模拟序列自相关系数拖尾但是偏相关系数截尾的序列数据的情况。因此在进行模型选定的时候画出来自相关系数图像和偏相关系数图像如果呈现前者拖尾后者截尾的情况,就是用AR模型。
那至于为什么有一个p,这就设计到延迟期数的问题,p就是表明序列值的偏相关系数在延迟期数为第p期的时候就瞬间掉至两倍标准差以下。
②MA(q)模型:
MA模型具有的特点就是能够很好模拟序列自相关系数q阶截尾但偏相关系数拖尾的情形
③ ARMA(p,q)模型:
ARMA模型具有的特点就是能够很好地模拟序列自相关系数和偏相关系数都呈现出拖尾特征的时间序列数据。上文以及此处的p和q都代表延迟的期数(t-p)
三、模型的选定步骤
① 观察序列值:
A. 进行平稳性检验,一般来说画时序图就能够看出来。如果不行的话再来看自相关图检验,看自相关系数是不是很快衰减至0就行了。
B. 进行白噪声检验,此处会用到Barlett检验方法,原假设为各期的自相关函数值延迟k期都为0,备择假设认为至少存在一个不为0,即存在显著的相关关系。p值<0.05就可以拒绝原假设了。
② 计算自相关函数和偏相关系数来进行模型识别,就和上面的模型相关了。
③ 模型的显著性检验和参数检验,和OLS那套一样的判断
④ 模型优化
由于一个拟合模型就算通过了检验,但是有效的模型绝对不止一个
优化的目的就是选择最好的模型,通常通过AIC准则来衡量,就是最少信息量。在OLS里面就是变量过多惩罚。似然函数值越大越好,未知参数越少越好,使用AIC或者SBC都可以,值越小越优。
四、各类别检验
① 模型的显著性检验
整个模型对信息的提取是否充分?Qlb统计量卡方检验残差序列是否为白噪声序列
② 参数的显著性检验
此处涉及到参数估计,参数估计的方法一般是矩估计、极大似然估计和最小二乘估计(OLS)
就可以当做是线性回归的方式来看待的。
模型结构是否最简,利用Dh统计量检验系数是否为0
五、ARIMA模型
ARIMA是加入了i阶差分后去除趋势等来保留平稳性的模型方法。一般是ARIMA(p,i,q)。