时序中的周期
T:长期趋势 S:季节变动 C:循环/周期因素 I:随机因素
现实时序数据多蕴含周期,比如周、季度(Q:为什么季节要单独拿出来?不也是周期吗)
首先提取周期信息可以更有效进行预测。
Step1 周期
人为定义周期,一般绘制时序图找周期(Q:多元时序中不同变量的周期有什么交互影响,要多时序图结合看吧)
Step2 计算周期因子
周均值->求比例
- 中位数(robust但损失信息)
->按列取中位数
- 均值(极端值影响)
- 综合1. 2.加权
Step3 计算Base (因子是要乘在Base上的)
1. 直接用最后一周的平均客流量作为base
2. 也许最后三天或最后五天的均值能更好的反映最新的情况(因为日期近新鲜数据?)但是,我们不能直接对最后三天客流量取均值(最后三天是周末,这样取的base就偏大了)。
3. 需要去掉周期性因素后,再取平均。具体做法,就是用客流量除以周期因子。
这样我们就可以取最后三天的平均,(108+91.4+120)/3=106.5,作为base。具体取多少天的,也要通过测试集的表现来确定。当然也可以按某些函数形式来给每天赋予不同的权重。
(Q:所以,这里的【周期因子*Base】就是C因素吗?之后加进加乘分解模型?)
参考: https://www.jianshu.com/p/31e20f00c26f
(未完待续)