天池新人实战赛o2o优惠券使用预测二

昨天直接提交的随机数据已经实现了整个提交测试流程,下面开始认真的思考问题了:

首先观察训练数据:

data = pd.read_csv('ccf_offline_stage1_train.csv')

print(data.head())
print(data.shape[0])
print(data.shape[1])

最终发现数据有:1754884行

其中有很多Coupon_id为null的数据。我们做的是优惠券使用预测,可是这些数据都没有用优惠劵,所以,首先将这些数据挑选出来。

data2 = data[data['Coupon_id'] == "null"]
print(data2.head())
print(data2.shape[0])
print(data2.shape[1])

最终发现null数据有:701602行,保存为.csv备用

data1.to_csv('ccf_offline_stage1_train_NoNull.csv',index=False,header=True)

不为null数据有:1053282行,保存为.csv备用

data2.to_csv('ccf_offline_stage1_train_Null.csv',index=False,header=True)


先看下null数据集合:

data = pd.read_csv('ccf_offline_stage1_train_Null.csv')
print(data.head())
print(data.shape[0])
print(data.shape[1])

结果出现错误:意思就是data没有null的

FutureWarning: elementwise comparison failed
这个是什么鬼?可能原因:

1)没有领取优惠券的全部消费了?

2)阿里提供数据的时候提供的都是消费数据,因为没有领取优惠劵,也没有实际消费的,在阿里不可能留下数据!

所以,我们在预测的时候,如果没有领取优惠券,可以直接预测为消费!(查看了test数据,不可能出现这种情况!)


再看下nonull数据集合

data = pd.read_csv('ccf_offline_stage1_train_NoNull.csv')
print(data.head())
print(data.shape[0])
print(data.shape[1])

取出负样本:没有消费的数据:

data2 = data[data['Date'] == "null"]
print(data2.head())
print(data2.shape[0])
print(data2.shape[1])

data2.to_csv('ccf_offline_stage1_train_N.csv',index=False,header=True)

发现负样本:977900个

同样取出正样本:

data1 = data[data['Date'] != "null"]
print(data1.head())
print(data1.shape[0])
print(data1.shape[1])
data1.to_csv('ccf_offline_stage1_train_P.csv',index=False,header=True)

正样本:75382个

那么平均的使用率为75382/1053282=0.071569








天池新人 O2O 优惠券是一项在线比,旨在鼓励参者运用数据析和机器学习技术来解决O2O优惠券发放的问题。O2O即“线上到线下”,是指将线上平台的服务与线下实体商店的购物场景结合起来的商业模式。而优惠券则是一种促销手段,可以为消费者提供折扣、赠品或者其他优惠活动。 这个比的主要任务是根据用户的线上活动行为、线下消费行为,以及优惠券的相关信息,预测用户是否会在规定的时间内使用优惠券来购买指定的商品。通过析大量的历史数据,参者需要构建准确的预测模型,同时考虑到用户的行为特征和优惠券的属性,从而提高优惠券使用效率和商家的销售转化率。 此项比的意义在于挖掘并优化O2O优惠券的发放策略,提供更精准的目标营销。通过合理析用户行为和优惠券的匹配关系,商家可以有针对性地向潜在消费者发放优惠券,从而提高用户的购买转化率和忠诚度。同时,这也可以减少优惠券的浪费,降低商家的营销成本。 通过参与天池新人 O2O 优惠券,参者将面临来自各方面的挑战和难题。不仅需要运用数据析和机器学习算法进行预测,还需要对于O2O领域的相关知识有一定的了解。此外,参者还可以通过与其他选手的交流和享经验,提高自己的解题能力以及理解O2O优惠券的商业价值。 总的来说,天池新人 O2O 优惠券是一项挑战性的比,旨在促进数据析和机器学习O2O领域的应用,为商家提供更智能化、精确化的优惠券发放策略,同时为消费者提供更个性化、经济实惠的购物体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值