一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。
自相关函数图和偏自相关函数图(ACF&PACF)
所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。
自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。
各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:
1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。
2、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。
3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。
4、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。
5、非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。
ARIMA是自回归移动平均结合(AutoRegressive Integrated Moving Average)模型的简写形式,用于平稳序列或通过差分而平稳的序列分析。
ARMA模型也称B-J方法,是一种时间序列预测方法。从字面上可以知道,ARMA模型是自回归模型(AR)和移动平均模型(MA)有效组合和搭配的结果,称为自回归移动平均模型。
ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通过变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合ARIMA模型。ARIMA模型又分为ARIMA(p,d,q)模型和ARIMA(p,d,q)(P,D,Q)s模型。
·ARIMA(p,d,q)模型
当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应的分析模型被概括为ARIMA(p,d,q),其中,d表示平稳化过程中差分的阶数。
·ARIMA(p,d,q)(P,D,Q)s模型
当序列中同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需要经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为ARIMA(p,d,q)(P,D,Q)s模型,其中,P,Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。
例子:
图形观察,确定初步模型
自相关函数图(ACF)和偏自相关函数图(PACF)是ARIMA模型识别中非常有用且非常直观的工具。
对序列首先进行取自然对数的数据变换,其次进行一阶逐期差分和一阶季节差分,得到一个基本平稳的序列。于是,模型中的d和D应同时取1;从自相关图看,在1阶以后函数值明显趋于0,呈拖尾性,因此可将q取1,而第12阶的函数值显著不为0,因此可将Q取为1;再看偏自相关图,前三阶函数值均显著不为0,滞后趋于0并呈拖尾性,因此可将p取为2或3,而第12阶也显著不为0,因此可考虑将P取为1。
时间序列分析:
观测值为06年至今的网站月均UV数,首先观测他的时序图
很明显,是一个有明显上升趋势的、带有季节周期性的非平稳时间序列,因此我们需要进行平稳化处理,我进行了平方根、一阶逐期差分和一阶季节性差分处理后,如下图:
平稳性得到有效改善,可以视为平稳时间序列
之后通过自相关图检验白噪声:
由于P值小于显著性水平,拒绝原假设,故认定此序列非白噪声序列;
1阶之后自相关函数值除12阶外趋于0且呈拖尾;
偏相关图里显示1阶之后偏自相关函数趋于0且呈拖尾;
我们使用ARIMA自回归移动平均模型来进行分析预测,进行调整后:
模型拟合程度较好
同时观察残差分布随机性较好,可以当做白噪声序列,说明已经很好的提取了相关因素
拟合曲线拟合较完美,其中对异常值进行了平滑化处理,异常值比如那些突发事件的时间;
预测结果如上图,7月预测值为30810462,而7月实际观察值为30724502,误差率约为0.3%,近乎完美,对于8月、9月的预测,可以等到该月结束后进行比较,看看准确率如何,一般来说,周期越短,预测越准,完毕~