Kaggle Predict Future Sales 竞赛（score 0.899, top 11%）报告

最新推荐文章于 2023-05-14 21:25:03 发布

Clark Kent 2000

最新推荐文章于 2023-05-14 21:25:03 发布

阅读量1.6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20241587/article/details/107720969

版权

Kaggle Predict Future Sales 竞赛报告唐健 jiantang2000@163.com 2020-07-31摘要Kaggle 上的Predict Future Sales竞赛提供了俄罗斯1C company 近3年来的销售数据，其要求是使用这些数据进行建模，并预测接下来一个月里的每个商店的每种商品的销售量。这篇报告介绍了如何参加这个比赛，给出了一个如何使用R语言进行数据清洗，特征工程抽取，模型构建的全过程。截止到2020/7/31，模型在竞赛中提交了15次，取得的最终分数

摘要由CSDN通过智能技术生成

Kaggle Predict Future Sales 竞赛报告

jiantang2000@163.com 2020-07-31

摘要

Kaggle 上的Predict Future Sales竞赛提供了俄罗斯1C company 近3年来的销售数据，其要求是使用这些数据进行建模，并预测接下来一个月里的每个商店的每种商品的销售量。这篇报告介绍了如何参加这个比赛，给出了一个如何使用R语言进行数据清洗，特征工程抽取，模型构建的全过程。截止到2020/7/31，模型在竞赛中提交了15次，取得的最终分数是0.899946，整体排名11%。

竞赛介绍

参加这个比赛是几乎无门槛的，我们可以直接访问竞赛的官网地址【1】，注册一个kaggle账号然后参与近来。

截止到2020/7/31，竞赛参与人数 8600+，总提交次数7.4W+，本人单人排名top11%.

竞赛提供的数据集为6个.csv文件，大小为近100M，分别包括了指定的训练集，指定的测试集，一个标准提交样本，商店信息，商品信息，商品分类信息。

训练集中包括精确到日的时间，月份编号，商店ID，商品ID，商品价格，商品当日销售量。
测试集中包括定位ID，商店ID，商品ID。
标准提交样本中包括定位ID，未来一个月的预测销售量。
商店信息中包括商店ID，商店名称（俄语）。
商品信息中包括商品名（俄语），商品ID，商品分类ID。
商品分类信息中包括商品分类编号，商品分类ID。

数据处理

缺失值处理

首先进行缺失值检测。缺失值处理的策略有很多：

直接删除（合适本场景）࿱

最低0.47元/天解锁文章

Clark Kent 2000

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
Kaggle Predict Future Sales 竞赛（score 0.899, top 11%）报告

Kaggle Predict Future Sales 竞赛报告唐健 jiantang2000@163.com 2020-07-31摘要Kaggle 上的Predict Future Sales竞赛提供了俄罗斯1C company 近3年来的销售数据，其要求是使用这些数据进行建模，并预测接下来一个月里的每个商店的每种商品的销售量。这篇报告介绍了如何参加这个比赛，给出了一个如何使用R语言进行数据清洗，特征工程抽取，模型构建的全过程。截止到2020/7/31，模型在竞赛中提交了15次，取得的最终分数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Clark Kent 2000 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。