2016.12.30回顾

30 篇文章 0 订阅
20 篇文章 0 订阅

1、date_sub,date_add的参数都是一个日期加一个时间INTERVAL,两个日期相差天数,to_days(日期或类日期字串)-to_days(日期或类日期字串),excel透视表分段,有一个group选项,可以选择起始点和终点以及步长

2、另外把gbdt用在了之前整理的数据集上,在开发集上效果逆天,在尝试过程中,涉及到了诸多pandas和numpy的操作

#导入csv
df = pd.read_csv("C:/woe_ds.csv")
#分自变量x
x = df.iloc[:,:-1]
#分因变量y
y = df.iloc[:,-1]
#最后一个参数stratify,可以选择根据哪个字段分层抽样,90%训练,10%测试
x_train,x_test,y_train,y_test = cross_validation.train_test_split(x,y,test_size=0.1,stratify=y)
#用默认参数生成一个gbdt分类器
gbdt = GradientBoostingClassifier()
gbdt.fit(x,y)
pred = gbdt.predict(x)
#这个会输出预测属于某一类的比例
pred_prob = gbdt.predict_proba(x)
#转成df方便使用concat进行拼接
df_pred_prob = pd.DataFrame(pred_prob)
df_y = pd.DataFrame(y)
print df_pred_prob
print df_y
#把预测值和y拼接在一起
result = pd.concat([df_pred_prob,df_y],axis=1)
#写成csv
result.to_csv("result.csv")


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值