天池新人实战赛o2o优惠券结果记录(随时更新)

0.700515552017-12-22
方法:
随机0~0.5
结果:0.53335

2017-12-25
方法:5个特征,随机森林
FUser1 线下领取优惠券后消费次数
FUser2 线下消费总次数
FMer1 线下总领取优惠券次数
FMer2 线下总领取优惠券后消费次数
FMer3 线下总消费次数
训练集准确率:0.9584821538771193
结果:0.57166541

2017-12-25
方法:9个特征,随机森林
FUser1 线下领取优惠券后消费次数
FUser2 线下消费总次数
FMer1 线下总领取优惠券次数
FMer2 线下总领取优惠券后消费次数
FMer3 线下总消费次数
FUM1 用户在此商户领取优惠券次数
FUM2 用户在此商户领取优惠券后消费次数
FUM3 用户在此商户领取消费次数
FUM4 用户和此商户距离
训练集准确率:0.9766026572181049
结果:0.57375090,训练集提升比较明显,测试集提高微乎其微,还是过拟合情况比较严重。

2017-12-26
方法:上面5个特征和9个特征的预测结果相加取平均
结果:0.57211081,说明好的方法和不好的方法平均后,性能下降了

2017-12-26
方法:9个特征,使用gbdt模型,参数如下:

gbdt=GradientBoostingRegressor(
  loss='ls'
, learning_rate=0.1
, n_estimators=100
, subsample=1
, min_samples_split=2
, min_samples_leaf=1
, max_depth=3
, init=None
, random_state=None
, max_features=None
, alpha=0.9
, verbose=0
, max_leaf_nodes=None
, warm_start=False
)

训练集准确率:0.9766843067668488
结果:0.57230987
貌似没有什么用啊,现阶段应该还是考虑更多的特征。

2017-12-27
方法:9个特征,随机森林
UM1、UM2、UM3缺失值使用平均值代替
结果:0.57327083
貌似也没有什么用呢?

2017-12-27
方法:9个特征,SVM
训练了一夜也没有训练完成,无奈抛弃SVM方法,大数据集上,以后再也不想了。

2017-12-27
今天突然发现随机森林的树居然只有10课,晕,这也叫森林吗?
时间有点来不及了,赶紧修改为40棵数
效果立竿见影:
结果:0.5744481

2017-12-28
修改为1000棵数据
结果:0.57358770 尼玛,居然还降低了,什么鬼

2017-12-29
划分出6个训练和测试集合对,分布训练出6个随机森林(5个特征,20棵数)
使用6个随机森林做回归,将回归值平均
结果:0.57324487

2017-12-30
划分出6个训练和测试集合对,分布训练出6个随机森林(5个特征,20棵数,正负样本1:1抽样)
使用6个随机森林做回归,将回归值平均
结果:0.57032266都没有什么用处……

2018-1-4
划分出6个训练和测试集合对,分布训练出6个随机森林(16个特征,10棵数,正负样本1:1抽样,PCA降维到4)
使用6个随机森林做回归,将回归值平均
结果:0.49847206效果一塌糊涂啊

2018-1-5
划分出6个训练和测试集合对,分布训练出6个随机森林(16个特征,80棵数,正常抽样)
使用6个随机森林做回归,将回归值平均
结果:0.57646588

2018-1-5
test集使用AUC作为评价,根据AUC做了各种优化,最终采样GBDT、正负样本1:6抽样,PCA降维到4,
结果:0.48443151,史上最烂结果,内心一万头神兽跑过
怀疑是自己建立的评价体系出了问题,一定得先把自己的评价结果和线上验证的结果能对接上,才能做下一步!

2018-1-6
test集使用平均AUC作为评价,根据结果做了各种优化,最终采样GBDT、PCA降维到12,test集结果:0.677163
结果:0.68496676 !

2018-1-6
test集使用平均AUC作为评价,根据结果做了各种优化,最终采样GBDT、PCA降维到12,test集结果:0.6804504
结果:0.69836318 !

结果总算正常了,现在只要test集结果提升,线上结果就能提升

2018-1-9
不使用任何test集,直接使用前面的训练参数和方法训练模型,提交结果
结果:0.70051555 晕倒,看了分组没有起到任何作用,就是能告诉自己模型大概水平而已

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
天池新人 O2O 优惠券是一项在线比赛,旨在鼓励参者运用数据分析和机器学习技术来解决O2O优惠券发放的问题。O2O即“线上到线下”,是指将线上平台的服务与线下实体商店的购物场景结合起来的商业模式。而优惠券则是一种促销手段,可以为消费者提供折扣、赠品或者其他优惠活动。 这个比赛的主要任务是根据用户的线上活动行为、线下消费行为,以及优惠券的相关信息,预测用户是否会在规定的时间内使用优惠券来购买指定的商品。通过分析大量的历史数据,参者需要构建准确的预测模型,同时考虑到用户的行为特征和优惠券的属性,从而提高优惠券的使用效率和商家的销售转化率。 此项比赛的意义在于挖掘并优化O2O优惠券的发放策略,提供更精准的目标营销。通过合理分析用户行为和优惠券的匹配关系,商家可以有针对性地向潜在消费者发放优惠券,从而提高用户的购买转化率和忠诚度。同时,这也可以减少优惠券的浪费,降低商家的营销成本。 通过参与天池新人 O2O 优惠券,参者将面临来自各方面的挑战和难题。不仅需要运用数据分析和机器学习算法进行预测,还需要对于O2O领域的相关知识有一定的了解。此外,参者还可以通过与其他选手的交流和分享经验,提高自己的解题能力以及理解O2O优惠券的商业价值。 总的来说,天池新人 O2O 优惠券是一项挑战性的比赛,旨在促进数据分析和机器学习在O2O领域的应用,为商家提供更智能化、精确化的优惠券发放策略,同时为消费者提供更个性化、经济实惠的购物体验。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值