时间序列预测入门(Time Series Forecasting)
- 参考书籍:《Forecasting: Principles and Practice》
- 原书籍链接:https://otexts.com/fpp2/
- 中译链接:https://otexts.com/fppcn/about-the-authors.html
- 知乎总结:https://zhuanlan.zhihu.com/p/67832773
- 其他商业预测相关书籍:Armstrong, J. S. (Ed.). (2001). Principles of forecasting: A handbook for researchers and practitioners. Kluwer Academic Publishers.
- Ord, J. K., Fildes, R., & Kourentzes, N. (2017). Principles of business forecasting (2nd ed.). Wessex Press Publishing Co.
- https://www.kaggle.com/thebrownviking20/everything-you-can-do-with-a-time-series/notebook kaggle 的一个分享
1. 什么事件是可预测的?
根据城市供电需求,预测5年后是否需要再建一个发电站?
一个事件的可预测性取决于以下三个因素:
- 对影响该事件发生的因素的了解情况;
- 可使用数据的规模;
- 预测对于预测事件本身的影响。
第三点主要指预测对事件本身产生的影响,如汇率的预测会直接影响汇率本身,这种预测事件又被称为 “efficient market hypothesis”(有效市场假设)。
2. 时间序列预测方法的一种分类方式
以用电量预测( hourly electricity demand)ED为例:
- 基于预测变量方法
ED = f(当前气温, 经济实力, 人口, 当日时间,星期几, 误差),该方法存在的缺点在于预测变量往往不能完全表示与预测值之间的关系,存在一定的不确切性。最后一项误差表示随机的波动与其他变量的总称。 - 时间序列方法
, t表示当前时间,t+1表示下一时间。在这里,对未来的预测是基于变量的过去值,而不是基于可能影响系统的外部变量。
- 混合模型
同时考虑时间序列、预测变量。
3. 预测任务总体的处理方法(不具体到数据,非论文、比赛步骤)
- 定义问题;
- 收集数据, 包括统计数据和背景知识;
- 探索性分析,通常使用图形统计分析长期趋势、季节性、异常值等;
- 选择拟合模型;
- 评估模型。