JData数据处理及高潜用户购买意向预测

最新推荐文章于 2025-01-26 19:41:28 发布

xmg26

最新推荐文章于 2025-01-26 19:41:28 发布

阅读量1w

点赞数 4

分类专栏：机器学习算法文章标签：机器学习算法数据预测

本文链接：https://blog.csdn.net/u013146882/article/details/79265924

版权

本文参与京东数据竞赛，通过历史销售数据预测用户未来5天的购买意向。介绍了数据清洗、特征工程、模型调优等步骤，包括用户和商品特征构建，使用XGBoost进行建模，并解决编程过程中的MemoryError问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

竞赛概述：

本次大赛以京东商城真实的用户、商品和行为数据（脱敏后）为基础，参赛队伍需要通过数据挖掘的技术和机器学习的算法，构建用户购买商品的预测模型，输出高潜用户和目标商品的匹配结果，为精准营销提供高质量的目标群体。同时，希望参赛队伍能通过本次比赛，挖掘数据背后潜在的意义，为电商用户提供更简单、快捷、省心的购物体验。

数据介绍：

符号定义：
S：提供的商品全集；
P：候选的商品子集（JData_Product.csv），P是S的子集；
U：用户集合；
A：用户对S的行为数据集合；
C：S的评价数据。

训练数据部分：
提供2016-02-01到2016-04-15日用户集合U中的用户，对商品集合S中部分商品的行为、评价、用户数据；提供部分候选商品的数据P。
选手从数据中自行组成特征和数据格式，自由组合训练测试数据比例。

预测数据部分：
2016-04-16到2016-04-20用户是否下单P中的商品，每个用户只会下单一个商品；抽取部分下单用户数据，A榜使用50%的测试数据来计算分数；B榜使用另外50%的数据计算分数(计算准确率时剔除用户提交结果中user_Id与A榜的交集部分)。

1、用户数据