时间序列预测
概览
1.时间序列:
一组按照事件发生先后顺序及逆行排列的数据。
2.时间序列预测:
预测序列在未来时间点的数值。
基于观测值(历史数据)预测未来
有些时间序列的预测还需要考虑其他会影响到观测值的变量,即外部变量(external regressor)。
3.如何做好时间序列预测:
编程+算法+业务和数据分析
4.应用:
零售商(生产,订货,定价)
工厂(人员,工作时长)
IT运维(服务器数量)
基金经理(股票的买入,卖出)
时间序列预测发展历史:
基于专家经验的预测方法;
传统统计学预测算法;
机器学习预测算法;
深度学习预测算法。
构建时间序列预测模型的通用流程
1.确定场景和预测结果的要求
开始之前,确定:
场景、预测对象、结果产生频率、预测期、时间颗粒度、截面颗粒度、准确性标准。
2.判断预测的难度(预判)
了解影响因素、大量的历史数据、是否有重复性。
用最简单的移动平均法预测效果如何。
3.收集数据
观测对象的历史数据、外部变量的历史数据和未来的数据。
4.数据探索性分析
1)数据的范围是什么?
2)数据中是否存在异常值、缺失值?
3)预测对象的趋势、周期性、自相关性如何?
4)外部变量如何影响观测对象?
5.选择合适的算法
1)是否需要具备可解释性?
2)是否能达到精度要求?
3)是否能达到运算性能的要求?
6.建模和测试
1)明确模型的输入、输出
2)划分训练集、验证集、测试集