ARIMA时间序列分析
作用:ARIMA时间序列分析通常用于对单列具有时间序列的数据进行预测,例如销售量预测,股票收盘价预测等等 ○ 输入:单列数据序列的数据,例如每个月销售额,每天股票的价格,通常数据量为15-50 条; ○ 输出:对未来5-15 天进行预测ARIMA模型的全称叫做自回归移动平均模型,也记作ARIMA(p,d,q),是统计模型中最常见的一种用来进行时间序列预测的模型。ARIMA模型建模的基本条件是要求待预测的数列满足平稳的条件,即个体值要围绕序列均值上下波动,不能有明显的上升或下降趋势,如果出现上升或下降趋势(不稳定数据),是无法捕捉到规律的,需要对原始序列进行差分平稳化处理。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动,可以使用ADF检验用于稳定性检验,使用差分分析对数据进行稳定性处理。
从步骤上讲,ARIMA时间序列分析共分为五个步骤:
○ Step1:ARIMA模型要求序列满足平稳性,查看ADF检验结果,根据分析t值,分析其是否可以显著地拒绝序列不平稳的假设(p<0.05或0.01)
○ Step2:查看差分前后数据对比图,判断是否平稳(上下幅度不大),同时对时间序列进行偏自相关分析、自相关分析,根据截尾情况估算其p、q值
○ Step3:ARIMA模型要求时间序列数据具备纯随机性,即模型残差为白噪声,查看模型检验表,根据Q统计量的p值对模型白噪声进行检验,也可以结合信息准则AIC和BIC值进行分析(越低越好),也可通过ACF/PACF图进行分析
○ Step4:根据模型参数表,得出模型公式