天池
masbbx123
这个作者很懒,什么都没留下…
展开
-
天池新人实战赛o2o优惠券使用预测一
1 首先注册天池帐号(可以使用支付宝直接登录)2 选择学习->算法入门赛3 选择:天池新人实战赛o2o优惠券使用预测,选择报名:4 阅读参赛的说明5 下载比赛数据:6 按照我的理解: ccf_offline_stage1_train.csv 对应的是Table1 ccf_online_stage1_train.csv 对应的是Tabl原创 2017-12-20 10:38:01 · 3492 阅读 · 0 评论 -
天池新人实战赛o2o优惠券使用预测二
昨天直接提交的随机数据已经实现了整个提交测试流程,下面开始认真的思考问题了:首先观察训练数据:data = pd.read_csv('ccf_offline_stage1_train.csv')print(data.head())print(data.shape[0])print(data.shape[1])最终发现数据有:1754884行其中有很多Coupon原创 2017-12-21 10:54:20 · 1475 阅读 · 0 评论 -
天池新人实战赛o2o优惠券使用预测三
还是继续进行数据分析和思考:data = pd.read_csv('ccf_offline_stage1_train.csv')d1 = data['Merchant_id']print(d1.value_counts())输出排名前列和后列的商户ID: 3381 142190 450 73866 5341 66747 760 60280 2934原创 2017-12-21 14:30:24 · 1148 阅读 · 0 评论 -
python随机森林
准备在天池新人赛中使用随机森林。 网上搜索了一个博客: http://blog.csdn.net/lulei1217/article/details/49583287 下面是自己实现的代码: from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble import RandomForestRegressor原创 2017-12-22 10:15:51 · 2859 阅读 · 0 评论 -
天池新人实战赛o2o优惠券使用预测四(别家代码分析1)
弄了2天,发现还是对python不够熟悉,完全不能实现我的各种设想,所以,还是先参考别人的代码,先明白别人的思路和python的写法再说吧。 源代码地址请直接在CSDN上搜索,原文说未经许可不得转载,所以我也不放地址了,就记录下自己的一些阅读的想法。 首先将数据集合分为3个部分: 看看这3个部分是什么样子的:print(feature1.shape)print(dataset1.shape)原创 2017-12-23 22:54:18 · 2427 阅读 · 1 评论 -
天池新人实战赛o2o优惠券使用预测五(第一个预测的程序)
扑腾了好久,总算出了第一个能预测的程序: 思路很简单,使用了下列5个特征:#用户相关特征:#FUser1 线下领取优惠券后消费次数#FUser2 线下消费总次数#商户相关特征:#FMer1 线下总领取优惠券次数#FMer2 线下总领取优惠券后消费次数#FMer3 线下总消费次数预测模型采用随机森林。 下面是提取User特征的代码:OffTrain = pd.read_csv('dat原创 2017-12-25 13:47:27 · 2709 阅读 · 4 评论 -
天池新人实战赛o2o优惠券使用预测六(新的思考)
指标好久没有什么大的提高了…… 再次想了想,记录下新的想法: 1 再看了看数据统计的情况data = pd.read_csv('data/ccf_offline_stage1_train.csv')t = data[data['Date_received'] != "null"]print(t['Date_received'].min())print(t['Date_received'].原创 2017-12-29 10:30:42 · 1375 阅读 · 0 评论 -
天池比赛中使用的一些python功能
导入pandas模块import pandas as pdfrom pandas import Series,DataFrame 读取.csv数据data = pd.read_csv('ccf_offline_stage1_train.csv')打印最后10行数据print(data.tail(10))打印前10行数据print(data.head(原创 2017-12-21 11:31:00 · 964 阅读 · 1 评论 -
天池新人实战赛o2o优惠券结果记录(随时更新)
2017-12-22 方法: 随机0~0.5 结果:0.533352017-12-25 方法:5个特征,随机森林 FUser1 线下领取优惠券后消费次数 FUser2 线下消费总次数 FMer1 线下总领取优惠券次数 FMer2 线下总领取优惠券后消费次数原创 2017-12-26 09:33:11 · 1728 阅读 · 9 评论