- 博客(16)
- 收藏
- 关注
原创 天池新人实战赛o2o优惠券使用预测六(新的思考)
指标好久没有什么大的提高了…… 再次想了想,记录下新的想法: 1 再看了看数据统计的情况data = pd.read_csv('data/ccf_offline_stage1_train.csv')t = data[data['Date_received'] != "null"]print(t['Date_received'].min())print(t['Date_received'].
2017-12-29 10:30:42 1375
原创 读取数据&线性回归
功能: 1 读取csv数据 2 转换数据格式 3 线性回归 4 1/x线性回归 5 绘制示意图import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_scor
2017-12-28 11:35:45 1082
原创 天池新人实战赛o2o优惠券结果记录(随时更新)
2017-12-22 方法: 随机0~0.5 结果:0.533352017-12-25 方法:5个特征,随机森林 FUser1 线下领取优惠券后消费次数 FUser2 线下消费总次数 FMer1 线下总领取优惠券次数 FMer2 线下总领取优惠券后消费次数
2017-12-26 09:33:11 1728 9
原创 天池新人实战赛o2o优惠券使用预测五(第一个预测的程序)
扑腾了好久,总算出了第一个能预测的程序: 思路很简单,使用了下列5个特征:#用户相关特征:#FUser1 线下领取优惠券后消费次数#FUser2 线下消费总次数#商户相关特征:#FMer1 线下总领取优惠券次数#FMer2 线下总领取优惠券后消费次数#FMer3 线下总消费次数预测模型采用随机森林。 下面是提取User特征的代码:OffTrain = pd.read_csv('dat
2017-12-25 13:47:27 2712 4
原创 天池新人实战赛o2o优惠券使用预测四(别家代码分析1)
弄了2天,发现还是对python不够熟悉,完全不能实现我的各种设想,所以,还是先参考别人的代码,先明白别人的思路和python的写法再说吧。 源代码地址请直接在CSDN上搜索,原文说未经许可不得转载,所以我也不放地址了,就记录下自己的一些阅读的想法。 首先将数据集合分为3个部分: 看看这3个部分是什么样子的:print(feature1.shape)print(dataset1.shape)
2017-12-23 22:54:18 2428 1
原创 python随机森林
准备在天池新人赛中使用随机森林。 网上搜索了一个博客: http://blog.csdn.net/lulei1217/article/details/49583287 下面是自己实现的代码: from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble import RandomForestRegressor
2017-12-22 10:15:51 2861
原创 天池新人实战赛o2o优惠券使用预测三
还是继续进行数据分析和思考:data = pd.read_csv('ccf_offline_stage1_train.csv')d1 = data['Merchant_id']print(d1.value_counts())输出排名前列和后列的商户ID: 3381 142190 450 73866 5341 66747 760 60280 2934
2017-12-21 14:30:24 1150
原创 天池比赛中使用的一些python功能
导入pandas模块import pandas as pdfrom pandas import Series,DataFrame 读取.csv数据data = pd.read_csv('ccf_offline_stage1_train.csv')打印最后10行数据print(data.tail(10))打印前10行数据print(data.head(
2017-12-21 11:31:00 964 1
原创 天池新人实战赛o2o优惠券使用预测二
昨天直接提交的随机数据已经实现了整个提交测试流程,下面开始认真的思考问题了:首先观察训练数据:data = pd.read_csv('ccf_offline_stage1_train.csv')print(data.head())print(data.shape[0])print(data.shape[1])最终发现数据有:1754884行其中有很多Coupon
2017-12-21 10:54:20 1478
原创 天池新人实战赛o2o优惠券使用预测一
1 首先注册天池帐号(可以使用支付宝直接登录)2 选择学习->算法入门赛3 选择:天池新人实战赛o2o优惠券使用预测,选择报名:4 阅读参赛的说明5 下载比赛数据:6 按照我的理解: ccf_offline_stage1_train.csv 对应的是Table1 ccf_online_stage1_train.csv 对应的是Tabl
2017-12-20 10:38:01 3496
原创 tensorflow图片分类
1 在github上下载tensorflow源码:https://github.com/tensorflow/tensorflow2 下载测试数据,例如:3 把下载好的图片解压,放到不同文件夹中:(中间有不是图像文件,代码会出错!)4 新建立好程序必须的几个目录,选择一部分图像作为测试数据:5 运行.bat,开始提取特征:(数据太多,速度好慢,为了测
2017-12-18 16:00:18 1182
原创 练数成金特训营
周末刚刚参加了练数成金的特训营,感觉收获非常大。 感觉有些内容真的有一种恍然大悟的感觉。现在技术发展真的很快,快到很多内容我还没有开始学就已经更新了6代了…… 现在问题已经基本没有了,只剩下时间核实践而已了。
2017-12-17 22:00:32 201
原创 cmake时出现coff错误
我的方法: 搜索cvtres.exe,会找到很多个,这其中肯定有一个是对的。所以一个一个修改文件名,最终剩下那个正确的时候,就可以cmake通过了。
2017-12-15 17:50:31 255
原创 基于深度学习的绘画风格迁移
代码来自:《零起点TensorFlow快速入门》,这里只记录几个出问题的地方:1 import arrow 出错 网上直接百度python arrow的安装,到arrow官网下载,然后cmd中输入python setup.py install安装。2 from stylize import stylize出错 百度了好久,没有找到资料,最后发现,原来这个是有一个.py文
2017-12-15 17:41:30 1401
原创 天池大赛
今天刚刚注册了帐号,参加了天池大赛。准备先做一个入门的淘宝穿衣的比赛,看看能做出什么样的指标出来。 参与天池大赛的几个好处: 1、有大量的真实的数据下载使用 2、有真实的业务场景 3、有很多人做同样的比赛,可以相互交流,共同提高
2017-12-14 22:53:30 2100 3
原创 2017年学习总结
2017年就要结束了,总结下2017年的学习:1、复习了机器学习,深度学习与神经网络,caffe的使用 对机器学习中的KNN,线性回归、广义线性回归,logistic回归、BP、决策树、随机森林、SVM有了更加深刻的理解。 caffe也能使用GPU版本运行,基本上了解了caffe的构建和应用。 对深度学习与神经网络有了更加深入的理解,自我感觉已经快要融会贯通了。
2017-12-14 11:07:08 417
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人