作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言数据高效处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书,《R语言数据高效处理指南》(黄天元)【简介_书评_在线阅读】 - 当当图书)。知乎专栏:R语言数据挖掘。邮箱:[email protected].欢迎合作交流。
ARIMA,全称Autoregressive Integrated Moving Average model,差分整合移动平均自回归模型,或称整合移动平均自回归模型,时间序列分析经典预测方法之一,涉及平稳、差分、自回归、滑动平均等多个基本概念,感兴趣请移步Chapter 8 ARIMA models | Forecasting: Principles and Practice。这里仅对预测流程的实现进行讲解,这也并不是一个简单的过程,包括:
1、可视化观察看是否有异常值;
2、如果需要的话,对数据进行转化,让时间序列平稳;
3、如果仍然不平稳,使用差分法(一阶差分、二阶差分...)让其平稳;
4、差分后,用ACF/PACF图对其进行定阶;
5、选出一系列的模型,然后使用AICc等标准对其效果进行评估,选出最优模型;
6、对模型进行残差分析,查看残差是否为白噪音;
7、如果是白噪音