记录学习安全库存需求预测路线、心得
前言
时序预测就是利用过去一段时间的数据来预测未来一段时间内的信息。预测结果依赖于数据在时间上的先后顺序,意思是,相同的数据改变输入顺序会得到不同的结果。
时序数据的预测涉及多种方式,如经典的时序预测方法、机器学习中的算法、深度神经网络等。
一、经典时序预测算法
1.AR-Aotu Regressive Model
自相关:自身前一部分的数据与后一部分数据有相关性;利用自相关性建立方程,进行预测分析。
如下公式为,p阶的自回归过程——AR(p);
(随机变量)的值与以前p期的序列值(自变量)相关;
表示自回归系数;
表示白噪声,是时间序列中的数值的随机波动,但是这些波动会相互抵消,最终是0。
当只有一个时间记录点,称为一阶自回归过程——AR(1)。
2.MA-Moving Average Model
一段时间序列中白噪声序列进行加权和,可以得到移动平均方程。如下方程,为q阶移动平均过程,表示为MA(q)。
(随机变量)的值与以前q期的平均值(自变量)相关;
表示自回归系数;
表示白噪声,是时间序列中的数值的随机波动,但是这些波动会相互抵消,最终是0。
3.ARMA-Auto Regressive Moving Average Model
自回归平均移动模型,由自回归与平均移动模型组成,可以表示为ARMA(p,q)。p自回归阶数,q是移动平均阶数。
AR可以解决当前数据与后期数据之间的关系,MA则可以解决随机变动也就是噪声的问题。
4.ARIMA-Auto Regressive Integrate Moving Average Model
差分自回归平均移动模型;
基于平稳的时间序列或者差分后是稳定的序列;
可以表示为ARIMA(p,d,q),其中p为自回归阶数,q为移动平均阶数,d为时间成为平稳时所做的差分次数。
补充知识点:
1、与ARMA的区别,ARIMA将非平稳的数据转化为平稳;
2、白噪声序列:特点表现在任何两个时点的随机变量都不相关,序列中没有任何可以利用的动态规律;
3、平稳非白噪声序列:例如:价格围绕价值波动;
4、平稳序列:如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且相距k期的序列变量之间的影响程度是一样的,则称为平稳序列。
5、非平稳序列:大多数时间序列都是非平稳的,一般可以通过差分、取对数等方法转化成平稳时间序列,若不成就不能使用平稳时间序列分析方法了。
6、拖尾: 自相关系数以指数率单调递减或震荡衰减;
相关系数度ACF量指的是两个不同事件彼此之间的相互影响程度;
自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量自己 过去的行为对自己现在的影响。
7、截尾:偏自相关系数PACF迅速降低到0附近,序列从某个时点变得非常小
5.步骤
a、时间序列的预处理
(1)、平稳性检验:
两种检验方法,一种是根据时序图和自相关图的特征做出判断的图检验,该方法操作简单、应用广泛,缺点是带有主观性;另一种是构造检验统计量进行的方法,目前最常用的方法是单位根检验。
- 时序图检验:
根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动的范围有界;如果有明显的趋势性或者周期性那它通常不是平稳序列。
- 自相关图检验:
平稳序列具有短期相关性,这个性质表明对平稳序列而言通常只有近期的序列值对现时值得影响比较明显,间隔越远的过去值对现时值得影响越小。
随着延迟期数k 的增加,平稳序列的自相关系数P:(延迟k期)会比较快的衰减趋向于零,并在零附近随机波动,而非平稳序列的自相关系数衰减的速度比较慢,这就是利用自相关图进行平稳性检验的标准。
- 单位根检验
单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。
b.平滑处理(非平稳转化为平稳)
(1)、差分运算:
p阶差分:相距一期的两个序列值之间的减法运算称为1阶差分运算;
k歩差分:相距k期的两个序列值之间的减法运算称为k 步差分运算。