本章是对应用系统负载和磁盘容量进行分析和预测,涉及到的数据为时间序列数据,因此最后是用ARMA模型去拟合。
本文主要包含以下部分:
- ARMA模型
- 平稳性检验
- 白噪声检验
- Python实战
- 总结
ARMA模型
关于ARMA模型,具体可看 [ 时间序列中的ARMA模型
](http://www.morefund.com/a/duichongshidian/2011/0422/327.html) 和 [ ARMA百度百科
](https://baike.baidu.com/item/ARMA%E6%A8%A1%E5%9E%8B/8048415?fr=aladdin) 。
本文摘录其主要部分:
模型基本原理
将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性。一方面,影响因素的影响,另一方面,又有自身变动规律,假定影响因素为
x 1 , x 2 ,…, x k ,由回归分析,
![这里写图片描述](https://img-
blog.csdn.net/20180111161343231?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMzM1MTk1MTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其中Y是预测对象的观测值,Z为误差。作为预测对象Yt受到自身变化的影响,其规律可由下式体现,
![这里写图片描述](https://img-
blog.csdn.net/20180111161351318?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMzM1MTk1MTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
误差项在不同时期具有依存关系,由下式表示,
![这里写图片描述](https://img-
blog.csdn.net/20180111161358733?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMzM1MTk1MTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
由此,获得ARMA模型表达式:
![这里写图片描述](https://img-
blog.csdn.net/20180111161404025?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMzM1MTk1MTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其他的模型定义:
![这里写图片描述](https://img-
blog.csdn.net/20180111173333093?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMzM1MTk1MTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
ARIMA模型运用的流程
- 根据时间序列的散点图、自相关函数和偏自相关函数图识别其平稳性。
- 对非平稳的时间序列数据进行平稳化处理。直到处理后的自相关函数和偏自相关函数的数值非显著非零。
- 根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
- 利用已通过检验的模型进行预测。
平稳性检验
按照上文所述,在进行时间序列模型选择之前需要对数据平稳性进行检验,接下来本文将对平稳性的定义和检验方法进行概述,主要内容参考自 [ 时间序列的平稳性及其检验
](https://wenku.baidu.com/view/75479e2ff8c75fbfc67db218.html) 。
时间序列的平稳性定义
定义:假定某个时间序列是由某一随机过程(stochastic process)生成的,如果满足下列条件:
- 均值E( X t )=μ是与时间t 无关的常数;
- 方差Var( X t )=σ是与时间t 无关的常数;
- 协方差Cov( X t , X t + k )= γ k 是只与时期