【数据竞赛】时间序列竞赛炸榜技巧

作者:杰少

时间序列元特征

简介

a0aa2ba117f74cb25492143abf2c1353.png

在时间序列等相关的问题中,除了许多传统的时间序列相关的统计特征之外,还有一类非常重要的特征,这类特征并不是基于手工挖掘的,而是由机器学习模型产出的,但更为重要的是,它往往能为模型带来巨大的提升。

b7558f9aeca952d64c17d7223e4de6b3.png

在实际的竞赛中也是百试不爽,基本每次使用都可以带来一定的提升,屡试不爽。

时间序列元特征

62cea5095a71dc05964edebc8e4e078d.png

对时间序列抽取元特征,一共需要进行两个步骤,第一步抽取元特征,第二步则是将元特征拼接到一起重新训练预测得到最终的预测结果。

01

元特征抽取

元特征抽取部分,我们先把数据按时间序列分为两块,

使用时间序列的第一块数据进行模型的训练得到模型1;

  1. 使用时间序列的第二块数据训练模型得到模型2;

  2. 使用模型1对第二块的数据进行预测得到第二块数据的元特征,使用模型2对第测试集的预测得到测试集元特征;

503cc67a1306709f0cc6ec9256863a1e.png

02

最终预测

接着元特征抽取部分得到的元特征,将元特征做为新的特征加入重新得到新的模型并重新进行预测得到最终的结果。

6f8e6c36aa602606f102de64527724d7.png

伪代码

8a0f4bc6e4432702cfb6b6b5ece15b34.png

# train_data1,train_data2,test_data

## step1
model_meta1 = train_model(train_data1)
model_meta2 = train_model(train_data2)

meta_feature1 = model_meta1.predict(train_data2)
meta_feature2 = model_meta2.predict(test_data)

## step2
model = train_model([train_data2,meta_feature1]) 
pred  = model.predict([test_data,meta_feature2])

适用问题

60537baea666885362774f1f1036e847.png

适用于所有的时间序列预测问题。

 
 
 
 
 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群955171419,加入微信群请扫码:

213fce04e0aaac394f1b4130049e1390.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值