-
读取数据集。dfoff, dftest ,dfon没用上。
-
查看dfoff(训练集)的信息,描述等。
-
查看dfoff数据集中,使用优惠券购买商品的条数,没使用优惠券购买商品的条数,
有优惠券却不购买商品的条数,没有优惠券也不购买商品的条数 -
处理 Discount_rate这个特征。
Discount_rate列,查看类型,发现有三类表示形式。
4.1:若折扣率类型为‘null’,表示没有折扣率,返回null
4.2:若折扣率类型中有‘:’,表示为满多少减多少,返回1
4.3:否则折扣率类型就为‘0.9’这种,返回0 -
把这三种类型统一转化为小数表示的折扣率
5.1:若折扣率类型为‘null’,表示没有折扣率,返回1.0
5.2:若折扣率类型中有‘:’, 表示为满多少减多少,返回1.0-float(减去的值)/float(满值)
5.3:否则折扣率类型就为‘0.9’这种,返回它本身。 -
把原来的Discount_rate列.apply上面的转换函数,得到新的discount_rate列。
把原来的Discount_rate列.apply上面的返回类型函数,得到新的discount_type列。 -
把距离列df[‘Distance’]中为空的值 替换为-1。替换后列名为df[‘distance’]
-
查看优惠券收到的日期和优惠券使用的日期。
8.1:收到优惠券表示Date_received列不为空,用sorted升序排列,
新的列名为date_received
8.2:使用优惠券表示Date列不为空,用sorted升序排列,
新的列名为date_buy
8.3:打印优惠券收到日期范围data_received[0]到data_received[-1],以及使用范围。 -
查看每一天,顾客收到coupon的数目,以及收到coupon后使用coupon的数目
查看两列,一列是收到优惠券的日期,一列是使用优惠券的日期
9.1:当收到优惠
阿里天池O2o优惠券预测思路
最新推荐文章于 2024-06-16 22:35:30 发布