2016.12.30回顾

原创 2017年01月03日 11:16:34

1、date_sub,date_add的参数都是一个日期加一个时间INTERVAL,两个日期相差天数,to_days(日期或类日期字串)-to_days(日期或类日期字串),excel透视表分段,有一个group选项,可以选择起始点和终点以及步长

2、另外把gbdt用在了之前整理的数据集上,在开发集上效果逆天,在尝试过程中,涉及到了诸多pandas和numpy的操作

#导入csv
df = pd.read_csv("C:/woe_ds.csv")
#分自变量x
x = df.iloc[:,:-1]
#分因变量y
y = df.iloc[:,-1]
#最后一个参数stratify,可以选择根据哪个字段分层抽样,90%训练,10%测试
x_train,x_test,y_train,y_test = cross_validation.train_test_split(x,y,test_size=0.1,stratify=y)
#用默认参数生成一个gbdt分类器
gbdt = GradientBoostingClassifier()
gbdt.fit(x,y)
pred = gbdt.predict(x)
#这个会输出预测属于某一类的比例
pred_prob = gbdt.predict_proba(x)
#转成df方便使用concat进行拼接
df_pred_prob = pd.DataFrame(pred_prob)
df_y = pd.DataFrame(y)
print df_pred_prob
print df_y
#把预测值和y拼接在一起
result = pd.concat([df_pred_prob,df_y],axis=1)
#写成csv
result.to_csv("result.csv")


相关文章推荐

海亮初中第四大周测试回顾与整理

先发一下题目 第一题: 1.栅栏作画   (paint.pas/c/cpp) 【问题描述】 冬去秋来,时光总是会改变一些东西。随着农夫Farmer John的老去,他的栅栏也越来越丑陋...

JavaScript知识点回顾

  • 2013年10月23日 09:12
  • 186KB
  • 下载

回顾一些重要的CNN改进模型(你真的了解 Convolutional Neural Networks 么)

转载自: 干货 | 你真的了解 Convolutional Neural Networks 么 https://mp.weixin.qq.com/s?__biz=MzAwMjM3MTc5OA==&...

面向对象前四章回顾

  • 2012年09月15日 19:49
  • 543KB
  • 下载

美新杯大赛历届题目回顾

  • 2012年03月17日 17:34
  • 66KB
  • 下载

如何开好迭代回顾会议(3)教练、不同的口味

另一种形式的迭代回顾会议     如何开好迭代回顾会议(1)(2)所介绍的通用迭代回顾会议,都是从解决问题出发而使用的回顾议程与工具。事实上,并不是每次迭代回顾会议都必须是解决问题。你偶尔可以帮团队...

软考网工考前回顾命令

  • 2010年04月22日 17:30
  • 36KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:2016.12.30回顾
举报原因:
原因补充:

(最多只允许输入30个字)