数据挖掘——时间序列算法之AR模型
先占个坑 (这句话是我在2019年11月21日20:44:39写的,哎时光飞逝啊,过了这么久我才来填这个坑)
1、平滑法
2、趋势拟合法
3、组合模型
4、AR模型
5、MA模型
6、ARMA模型
7、ARIMA模型
8、ARCH模型
9、GARCH模型及其衍生模型
最近遇到一个项目,是典型的的时间序列预测问题,所以有必要把这部分内容捡起来了,话不多说,开写。(2020年4月15日)
AR模型名为自回归模型(请注意,顾名思义,该算法有一个系数回归的内容),在介绍AR模型之前有必要回忆时间序列的平滑法,回忆他主要目的是回忆其思想,该思想就是计算要预测值时,要考虑之前的p个时间的数据,同理AR模型也是这样的思想。
先看下AR模型的数学表达:
x
t
=
φ
0
+
φ
1
x
t
−
1
+
φ
2
x
t
−
2
+
.
.
.
+
φ
p
x
p
−
1
+
ε
t
x_{t}=\varphi_{0}+\varphi_{1}x_{t-1}+\varphi_{2}x_{t-2}+...+\varphi_{p}x_{p-1} +\varepsilon _{t}
xt=φ0+φ1xt−1+φ2xt−2+...+φpxp−1+εt
解释上式中涉及的变量,
x
t
x_{t}
xt是当前时刻需要预测的值,
φ
0
,
.
.
.
,
φ
p
\varphi_{0},...,\varphi_{p}
φ0,...,φp是需要使用回归算法计算的回归系数(只与他有什么用,下面有说明),p是选择计算当前时间点之前的p个时间点,
ε
t
\varepsilon_{t}
εt是当前的随机干扰,为零均值白噪声序列。
可以看到计算当前的预测值时,是有前p的时间点的数据参与的,与指数平滑算法思想相同,但是AR模型为了减少因数据本身的问题(突增,突减等等),使用参数控制每个之前时间点的贡献度,与平滑算法不同的是,AR算法的参数是使用回归算法计算出来的。
平稳AR模型的性质
统计量 | 性质 |
---|---|
均值 | 常数均值 |
方差 | 常数方差 |
自相关系数(ACF) | 拖尾 |
偏自相关系数(PACF) | p阶截尾 |
上面的表格是什么意思,请看此篇序列平稳性检验