时序学习预测赛-读书笔记3

Day 5&6 建模预测&总结

时序建模与其他类型数据建模的差别

一、training set, testing set, validation set的划分(滑窗划分法)

​ 与其他结构型数据采取随机shuffle后切割原始数据集,或者考虑样本分布(targets分布)shuffle后划分原始数据集不同,时序数据由于其连续性,如果随机shuffle后切割会破坏时序特征。

​ 因此,时间序列数据需要通过滑窗的方法进行划分训练集、测试集和验证集。具体划分方法如下:

在这里插入图片描述

步长为7天的解释:

​ 对于此次竞赛数据,当以一周为维度做EDA分析时,发现total_purchase_amt,total_redeem_amt有较为规律的周期性,因此选择步长为7天,可以确保每次在采取不同时间段数据训练、测试时,里面的周期是完整的。

二、加入周期因子

​ 回归到企业的真实业务场景,如果该时序数据是具体产品的某方面数据,那么在该产品运营的各个阶段,会存在不同程度的周期性规律。(如股票市场经历慢牛,会出现长期较为稳定的交易量增长趋势,此时定投人数较市场行情剧烈波动时多;如美元外汇市场,会跟随美国定期发布的非农业就业人口数据呈现周期性反应……)

​ 在此次比赛中,数据是关于支付宝的一项货币型基金的业务数据。支付宝货币型基金一般而言,有着低风险、流动性好(提现即时到账)、利率高于银行活期储蓄等特点。这也使得购买人群有以下习惯:

  1. 有闲钱就想存进去

  2. 缺钱用就取出来

  3. 利率震荡期购买和赎回量随利率高低波动

  4. 利率稳定期,交易量呈现较为明显的周期性变化

    因此加入周期因子可以在预测利率稳定期有着较好的预测效果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值