赛题数据以及介绍:天池新人赛:o2o优惠券使用预测
代码来源:第一名解题思路及SQL代码
比赛是根据线下的数据来预测优惠券在15天内的使用情况,之前在看了wepon大神的python代码后用R做了数据的预处理以及特征提取等工作,发现对自己码代码能力有了很大的提升。第二赛季他用的SQL语句写的,正好现在也需要学习SQL,所以就把直接看着他的代码学吧!!!
注:
1.因为他分了dataset1-dataset3,feature1-feature3,所以所有代码都会重复三次,我就只以dataset1 和feature1为例
2.我使用的是sql server,而wepon使用的oracle 所以部分代码会有所不同,但整体的过程是一样的
1.数据的划分
-----数据的划分方法的代码和他的有所不同,create table 好像是在oracle里面的方法,但是两组代码的结果都是一样的
select *
into cou_dataset1
from offline_train_data
where '20160414'<=Da