记录第一次参加数据挖掘比赛

本文记录了作者首次参加数据挖掘比赛的经历,任务是根据历史需求和库存数据预测未来3个月的产品物料需求量。通过对数据进行探索、特征工程,包括时间块特征、时间窗特征和滞后影响等,构建了预测模型。然而,模型表现不佳,引发作者对特征选择和模型优化的反思。
摘要由CSDN通过智能技术生成

先看一眼任务:

根据产品物料的需求历史数据和库存历史数据,预测每个工厂的每个产品物料未来3个月的需求量,每月25号之前要给出未来3个月的需求量预测结果,从而可以指导工厂备货与生产。

这个任务就是时间序列的回归预测,根据历史需求量数据来预测未来的3个月需求量。

再看一眼数据描述:

训练数据描述
初赛提供了不同工厂共304种产品物料2018年1月1日至2020年11月24号的历史需求量数据和历史库存数据,历史需求量数据数据包括以下信息:过账日期、需求量、工厂编码、物料编码、物料品牌、物料类型、物料品类,其中“过账日期”为某日的需求量,一个“物料类型”会对应多个“物料品类”。历史库存数据是提供每月24号时各个工厂的各个物料的库存量。

测试数据描述
测试集可根据历史需求量训练数据集分割得到,例如:可以取历史需求量训练集最新3个月的数据作为测试集。

第一步,导包

 

 然后给数据下下来,我们大致看一眼数据:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值