一、arima原理
1.1自回归模型AR
自回归模型描述当前值与历史值之间的关系,用变量自身的历史事件数据对自身进行预测。自回归模型必须满足平稳性的要求。
1)自回归模型首先需要确定一个阶数p,表示用几期历史值来预测当前值。p阶自回归模型的公式定义为:
a)用自身数据进行预测
b)时序数据必须具有平稳性,均值为0
c)自回归只适用于预测与自身前期相关的现象
d)自相关系数呈复指数衰减-有拖尾性
e)偏自相关系数有截尾性
1.2移动平均模型MA
移动平均模型关注的是自回归模型中的误差项的累加,q阶自回归过程公式定义如下:
移动平均能有效地消除预测中的随机波动。
1)自相关系数截尾巴
2)偏自相关系数拖尾
1.3自回归移动平均模型ARMA
自回归模型AR和移动平均模型MA模型相结合,
模型 自相关系数 偏自相关系数
AR§ 拖尾 p阶截尾
MA(q) q阶截尾 拖尾
ARMA(p,q) 拖尾 拖尾
1.4差分自回归移动平均模型ARIMA
将自回归模型、移动平均模型和差分法结合。ARIMA(p,d,q),的就是差分的阶数。
二、建立ARIMA模型的过程
2.1数据平稳性处理和判断
平稳性就是要求经由样本时间序列所得到的拟合曲线在未来一段时间仍能沿着现有的形态惯性地延续下去。平稳性要求序列的均值和方差不发生明显的变化。
严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳.
宽平稳是使用序列的特征统计量来定义的一种平稳性.它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
2.1.1平稳性处理