自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 天池新人实战赛o2o优惠券使用预测六(新的思考)

指标好久没有什么大的提高了…… 再次想了想,记录下新的想法: 1 再看了看数据统计的情况data = pd.read_csv('data/ccf_offline_stage1_train.csv')t = data[data['Date_received'] != "null"]print(t['Date_received'].min())print(t['Date_received'].

2017-12-29 10:30:42 1375

原创 读取数据&线性回归

功能: 1 读取csv数据 2 转换数据格式 3 线性回归 4 1/x线性回归 5 绘制示意图import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_scor

2017-12-28 11:35:45 1082

原创 天池新人实战赛o2o优惠券结果记录(随时更新)

2017-12-22 方法: 随机0~0.5 结果:0.533352017-12-25 方法:5个特征,随机森林 FUser1 线下领取优惠券后消费次数 FUser2 线下消费总次数 FMer1 线下总领取优惠券次数 FMer2 线下总领取优惠券后消费次数

2017-12-26 09:33:11 1728 9

原创 天池新人实战赛o2o优惠券使用预测五(第一个预测的程序)

扑腾了好久,总算出了第一个能预测的程序: 思路很简单,使用了下列5个特征:#用户相关特征:#FUser1 线下领取优惠券后消费次数#FUser2 线下消费总次数#商户相关特征:#FMer1 线下总领取优惠券次数#FMer2 线下总领取优惠券后消费次数#FMer3 线下总消费次数预测模型采用随机森林。 下面是提取User特征的代码:OffTrain = pd.read_csv('dat

2017-12-25 13:47:27 2712 4

原创 天池新人实战赛o2o优惠券使用预测四(别家代码分析1)

弄了2天,发现还是对python不够熟悉,完全不能实现我的各种设想,所以,还是先参考别人的代码,先明白别人的思路和python的写法再说吧。 源代码地址请直接在CSDN上搜索,原文说未经许可不得转载,所以我也不放地址了,就记录下自己的一些阅读的想法。 首先将数据集合分为3个部分: 看看这3个部分是什么样子的:print(feature1.shape)print(dataset1.shape)

2017-12-23 22:54:18 2428 1

原创 python随机森林

准备在天池新人赛中使用随机森林。 网上搜索了一个博客: http://blog.csdn.net/lulei1217/article/details/49583287 下面是自己实现的代码: from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble import RandomForestRegressor

2017-12-22 10:15:51 2861

原创 天池新人实战赛o2o优惠券使用预测三

还是继续进行数据分析和思考:data = pd.read_csv('ccf_offline_stage1_train.csv')d1 = data['Merchant_id']print(d1.value_counts())输出排名前列和后列的商户ID: 3381 142190 450 73866 5341 66747 760 60280 2934

2017-12-21 14:30:24 1150

原创 天池比赛中使用的一些python功能

导入pandas模块import pandas as pdfrom pandas import Series,DataFrame 读取.csv数据data = pd.read_csv('ccf_offline_stage1_train.csv')打印最后10行数据print(data.tail(10))打印前10行数据print(data.head(

2017-12-21 11:31:00 964 1

原创 天池新人实战赛o2o优惠券使用预测二

昨天直接提交的随机数据已经实现了整个提交测试流程,下面开始认真的思考问题了:首先观察训练数据:data = pd.read_csv('ccf_offline_stage1_train.csv')print(data.head())print(data.shape[0])print(data.shape[1])最终发现数据有:1754884行其中有很多Coupon

2017-12-21 10:54:20 1478

原创 天池新人实战赛o2o优惠券使用预测一

1 首先注册天池帐号(可以使用支付宝直接登录)2 选择学习->算法入门赛3 选择:天池新人实战赛o2o优惠券使用预测,选择报名:4 阅读参赛的说明5 下载比赛数据:6 按照我的理解:    ccf_offline_stage1_train.csv  对应的是Table1    ccf_online_stage1_train.csv  对应的是Tabl

2017-12-20 10:38:01 3496

原创 tensorflow图片分类

1 在github上下载tensorflow源码:https://github.com/tensorflow/tensorflow2 下载测试数据,例如:3 把下载好的图片解压,放到不同文件夹中:(中间有不是图像文件,代码会出错!)4 新建立好程序必须的几个目录,选择一部分图像作为测试数据:5 运行.bat,开始提取特征:(数据太多,速度好慢,为了测

2017-12-18 16:00:18 1182

原创 练数成金特训营

周末刚刚参加了练数成金的特训营,感觉收获非常大。    感觉有些内容真的有一种恍然大悟的感觉。现在技术发展真的很快,快到很多内容我还没有开始学就已经更新了6代了……    现在问题已经基本没有了,只剩下时间核实践而已了。

2017-12-17 22:00:32 201

原创 cmake时出现coff错误

我的方法:        搜索cvtres.exe,会找到很多个,这其中肯定有一个是对的。所以一个一个修改文件名,最终剩下那个正确的时候,就可以cmake通过了。

2017-12-15 17:50:31 255

原创 基于深度学习的绘画风格迁移

代码来自:《零起点TensorFlow快速入门》,这里只记录几个出问题的地方:1 import arrow 出错    网上直接百度python arrow的安装,到arrow官网下载,然后cmd中输入python setup.py install安装。2 from stylize import stylize出错    百度了好久,没有找到资料,最后发现,原来这个是有一个.py文

2017-12-15 17:41:30 1401

原创 天池大赛

今天刚刚注册了帐号,参加了天池大赛。准备先做一个入门的淘宝穿衣的比赛,看看能做出什么样的指标出来。    参与天池大赛的几个好处:    1、有大量的真实的数据下载使用    2、有真实的业务场景    3、有很多人做同样的比赛,可以相互交流,共同提高

2017-12-14 22:53:30 2100 3

原创 2017年学习总结

2017年就要结束了,总结下2017年的学习:1、复习了机器学习,深度学习与神经网络,caffe的使用    对机器学习中的KNN,线性回归、广义线性回归,logistic回归、BP、决策树、随机森林、SVM有了更加深刻的理解。    caffe也能使用GPU版本运行,基本上了解了caffe的构建和应用。    对深度学习与神经网络有了更加深入的理解,自我感觉已经快要融会贯通了。

2017-12-14 11:07:08 417

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除