学习资料:
https://github.com/ChuanyuXue/The-Purchase-and-Redemption-Forecast-Challenge-baseline
之前接触的时间序列,一般是使用ARMA模型进行预测,基于周期因子的方法,是第一次接触到,经过两天的简单沉淀下学习心得:
1.使用前提:数据可以有周期性,但总体趋势需要相对平稳(时间从14年3月开始使用的原因)
2.该方法的核心是周期因子和base值:
周期因子的一般计算方法根据历史数据计算每天(周一至周日的维度)的均值,再除以所有历史数据的均值(从周期因子的计算方法中也可以看到历史数据如果有明显的趋势,对因子的可信度有比较大的影响)
base值可以使用最后一个周期的数据,或者去掉周期性因素后的平均值
在该资料中对月度数据进行预测,对月度周期因子做了比较巧妙的计算,我可能是直接会把维度换成月份进行计算,但是资料中的操作是,对历史月份统计每天为周一至周日的频率,加权平均求出每天的因子数。具体操作可看上面链接
不同的base值及周期因子的计算,会对结果有比较大影响;实战中使用上个月数据作为base值及使用不同的因子计算方式,得分都相对较低,最后还是从资料中借鉴计算方式