阿里天池O2o优惠券预测思路

  1. 读取数据集。dfoff, dftest ,dfon没用上。

  2. 查看dfoff(训练集)的信息,描述等。

  3. 查看dfoff数据集中,使用优惠券购买商品的条数,没使用优惠券购买商品的条数,
    有优惠券却不购买商品的条数,没有优惠券也不购买商品的条数

  4. 处理 Discount_rate这个特征。
    Discount_rate列,查看类型,发现有三类表示形式。
    4.1:若折扣率类型为‘null’,表示没有折扣率,返回null
    4.2:若折扣率类型中有‘:’,表示为满多少减多少,返回1
    4.3:否则折扣率类型就为‘0.9’这种,返回0

  5. 把这三种类型统一转化为小数表示的折扣率
    5.1:若折扣率类型为‘null’,表示没有折扣率,返回1.0
    5.2:若折扣率类型中有‘:’, 表示为满多少减多少,返回1.0-float(减去的值)/float(满值)
    5.3:否则折扣率类型就为‘0.9’这种,返回它本身。

  6. 把原来的Discount_rate列.apply上面的转换函数,得到新的discount_rate列。
    把原来的Discount_rate列.apply上面的返回类型函数,得到新的discount_type列。

  7. 把距离列df[‘Distance’]中为空的值 替换为-1。替换后列名为df[‘distance’]

  8. 查看优惠券收到的日期和优惠券使用的日期。
    8.1:收到优惠券表示Date_received列不为空,用sorted升序排列,
    新的列名为date_received
    8.2:使用优惠券表示Date列不为空,用sorted升序排列,
    新的列名为date_buy
    8.3:打印优惠券收到日期范围data_received[0]到data_received[-1],以及使用范围。

  9. 查看每一天,顾客收到coupon的数目,以及收到coupon后使用coupon的数目
    查看两列,一列是收到优惠券的日期,一列是使用优惠券的日期
    9.1:当收到优惠

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值