本篇是(二)时间序列规则 学习笔记
2.1 为什么要重视规则
很多比赛都可以基于对背景的理解和数据分析获得有用规则,设计效果良好的基准方案。
不同规则下,得到结果也有所不同。
在企业、公司也常采用基于规则的方案:
(1)简单、高效
(2)可解释性强
2.2 中位数、临近数据等简单统计量
一些简单的统计量,可以作为特征使用
• 中位数:稳健
• 均值:当分布较符合正态分布时
• 临近数据:临待预测数据较近的数据
• 云上贵州2017智能交通预测挑战赛;7:50-8:00的旅行时间对8:00-8:10的预测效果不错
• 京东店铺销量预测;直接使用1月底后90天的销量作为预测(初期前100)
2.3 基于周期因子的时间序列预测
• 支付数据、客流量数据、交通数据等时间序列通常都具有明显的周期性
• 周期性是核心
• 确定周期(一周、一月)
• 确定组成一个周期的元素(周1-周日、1-31号)
• 结合STL分解观察周期变化
• 缺点:不考虑节假日、突发事件等
实例:
2. 基于时间序列规则的资金流入流出预测
2.1 以星期为周期的中位数预测
2.2 基于周期因子(以星期为周期