Task02:时间序列规则

Task02:时间序列规则

规则做预测的重要性

		我感觉能写好规则的人都很厉害,有一次拍拍贷的比赛,我队友一个规则的成绩跑平了lgb的好多模型,直接进入复赛。还是这个队友在cikm2019大规模推荐比赛中,用自己写的规则进入前50,差点弄过了我的协同过滤。据我所知拍拍贷的第一可以用规则,机器学习以及nn都达到第一的分数。

时间规则的基本方法

在这里插入图片描述
第一步: 除以周均值,得到一个比例。
第二步: 按列取中位数。
在这里插入图片描述
预测时,以100为base,得到下表
在这里插入图片描述

针对周期因子的优化

	可以使用平均值和中位数,然后将均值和中位数融合。比例按照测试集的表现进行确定。也可以依据与周期的时间距离来赋予不同的权重。

针对base的优化

在这里插入图片描述
结果=第三周/中位数;直接用最后一周的平均客流量作为base并不一定是最好的方法。也许最后三天或最后五天的均值能更好的反映最新的情况。但是,我们不能直接对最后三天客流量取均值(最后三天是周末,这样取的base就偏大了)。需要去掉周期性因素后,再取平均。具体做法,就是用客流量除以周期因子。
这样我们就可以取最后三天的平均,(108+91.4+120)/3=106.5,作为base。具体取多少天的,也要通过测试集的表现来确定。当然也可以按某些函数形式来给每天赋予不同的权重。

https://www.jianshu.com/p/31e20f00c26f

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值