pipeline+crossvalidation 调整参数值

由于刚刚进入这个领域,用sklearn在几个toy dataset上跑了几个算法后,就在发愁如何调整参数值的事情,在看了sklearn的官方文档和一些csdn之后整理如下:



官方网站给出了如上的一种评分方式,以这个为基础,通过不同的切分train dataset得到train和test 我们可以得到一个平均得分(当然通过改变参数scoring的值,具体规则在这http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter),如下(cv=5就是连续分割5次的意思)



(此处得到平均准确率以及方差)

如果cv是一个整数,那么cross_val_score会使用kfold 或者stratifiedKfold来分割trainset。

当我们的数据需要预处理的时候,我们可以先调用 sklearn.preprocessing,里面会有很多预处理函数(http://www.cnblogs.com/chaosimple/p/4153167.html),来达到更好的学习效果(用pipeline可以更快的实现这一切):


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值