Datawhale AI 夏令营 :Task2学习笔记

一、任务:入门lightgbm,开始特征工程。

      通过进阶的机器学习模型lightgbm来解决本次任务的问题,可以学会以下知识:

  1. 使用数据集绘制柱状图和折线图

     2. 使用时间序列数据构建历史平移特征和窗口统计特征

     3. 使用lightgbm模型进行训练并预测

二、解决问题思路

        由于本次的任务是回归预测,所以要想取得较好的效果,应该要使用到机器模型,如LightGBM、XGBoost,这种模型使用较简单,不需要对数据做过多的处理,只需要按照以下步骤来进行即可:

①探索性数据分析,主要是对数据集的处理,读取训练集和测试集

②数据预处理

③提取特征:通过特征工程来挖掘特征:在这次任务中采取了历史平移特征和窗口统计特征:

历史平移特征:把d-1时间的信息给d时间,d时间给d+1时间,这样就可以实现平移一个单位的特征构建。

窗口统计特征:窗口统计可以构建不同的窗口大小,然后基于窗口范围进行统计均值、最大值、最小值、中位数等信息,可以反应最近阶段数据的变化情况。

④切分训练集与验证集:由于数据存在时序关系,所以严格按照时序进行切分。,这样可以保证不会使用未来数据去预测历史数据。

⑤训练模型:在此次任务中,选择的是lightgbm,可以在不用调参的情况下也能得到比较稳定的分数

⑥预测结果

三、具体代码分析

     (1)首先需要导入各种包

(2)进行探索性分析

(3)对数据进行可视化分析,可以更好的了解数据,同时画出了id为00037f39cf的一个折线图

(4)训练模型与测试集预测

四、运行结果

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值