–阿里天池新人赛中的一个,记录分享。
Repeat Buyers Prediction-Challenge the Baseline-天池大赛-阿里云天池
第一次提交:8简单特征,随机森林模型,score:0.5507327,排名:278
第二次提交:13特征,随机森林模型,score:0.5980033,排名:251
第三次提交:13特征,lightgbm模型,score:0.648646,排名:179
其实不止三次,控制变量提交过很多次,U. U。
用户复购行为预测
1.项目介绍
1.1背景和目的
淘宝卖家会做一系列营销活动以增长用户,但许多情况下,新增用户大多不会复购,不利于卖家的长远利益。因此对于卖家来说,定位较大概率会复购的用户很重要,可以降低营销成本并提高ROI。
阿里天池提供了在“双十一”期间的一组卖家及其相应的新买家数据集,包括这些新买家在前半年的购物行为日志,以及在后半年是否有复购的记录。
通过对上述数据集的挖掘分析,预测新用户的复购行为,为店铺运营提供高效的营销决策。
1.2数据集范围和结构
数据集来自淘宝抽取的一组某年双11期间店铺的新买家,并采集了这批用户的前半年用户日志、用户信息<user_info>,以及后半年是否有在该店铺复购的数据,数据均转换处理过,详细字段见比赛数据页面,数据关系结构如下: