天池o2o消费券比赛速记

比赛地址https://tianchi.aliyun.com/competition/entrance/231593/introduction

包括了比赛的各种细节、数据等等

我是参考了第一名的方法

特征+xgboost

第一名的代码和思路参考https://github.com/wepe/O2O-Coupon-Usage-Forecast

第一名给出了思路和代码但是不够详细,有些细节也难以理解,在论坛上找到了一位参考第一名的思路但是实现更加完善的方案

https://blog.csdn.net/weixin_42001089/article/details/85013073

重点划分:

算法是通用的、主要难点就是在特征工程,数据本身字段很少,能够提取到的特征很有限(我自己弄了半天的特征+xgboost试了多次AUC都是0.5。哭了 )

首先是简单的数据清洗、异常值处理、类型单位转换、数据分析等

第一名的思路利用了窗口,通过时间窗口将数据分为多个训练和测试集,测试集时间>训练集

训练集特征用到了提取label相关的字段(提取类似消费习惯、付费习惯之类的特征),测试集不涉及label相关字段,最终的特征是训练集和测试集特征的join,因为是通过之前的消费习惯预测未来是否会使用优惠券付费

还有一

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值