使用的算法:AR模型,MA模型,ARIMA(组合)模型
数据:本案例使用航空乘客数据(AirPassengers.csv)作为样例,数据是从1949年到1960年间每个月的乘客量,格式如下图:
在使用算法预测前需要检验序列的稳定性,并消除趋势:
1. 检验时间序列的稳定性
如果一个时间序列的统计特征如平均数,方差随着时间保持不变,我们就可以认为它是稳定的。
稳定性的确定标准是非常严格的。但是,如果时间序列随着时间产生恒定的统计特征,根据实际目的我们可以假设该序列是稳定的。如下:
- 恒定的平均数
- 恒定的方差
- 不随时间变化的自协方差
2. 消除趋势
对时间序列需要做的消除趋势的工作,案例中提出了几种方法,最后使用的是转换。
转换(本例选择的方案)
消除趋势的第一个方法是转换。例如,在本例中,我们可以清楚地看到,有一个显著的趋势。所以我们可以通过变换,惩罚较高值而不是较小值。这可以采用对数,平方根,立方根等等。本例使用转换为对数,即对原始时间序列做取对数处理。
移动平均数
在这个方法中,根据时间序列的频率采用“K”连续值的平均数。我们可以采用过去一年的平均数,即过去12个月的平均数。
指数加权移动平均法
所我们采取“加权移动平均法”可以对最近的值赋予更高的权重。指数加权移动平均法是很受欢迎的方法,所有的权重被指定给先前的值连同衰减系数。