SKLEARN模型选择

本文介绍了SKLEARN中的模型选择方法,包括K折交叉验证、留一法、随机划分法等数据集划分策略,以及网格搜索和随机采样等超参数优化技术。此外,还探讨了模型验证方法,如学习率曲线的绘制,以及评估模型性能的score方法和scoring参数的使用。
摘要由CSDN通过智能技术生成

数据集划分方法

在这里插入图片描述

K折交叉验证法

  1. 将全部训练集S分成k个不相交的子集,假设S中的训练样例子数为m,那么每一个子集有m/k个训练样例,相应子集称作{s1,s2……sk}
  2. 每次从分好的子集里面,拿一个作为测试集,其他k-1作为训练集
  3. 在k-1个训练集中训练出学习器模型
  4. 把这个模型放到测试集上,得到分类率
  5. 计算k次求得的分类率的平均值,作为改模型或者假设函数的真实分类率
  6. 这个方法充分利用了所有样本,但计算比较繁琐,需要训练k次,测试k次
    在这里插入图片描述

留一法

假设有N个样本,将每一个样本作为测试样本,其它N-1个样本作为训练样本,这样得到N个分类器,N个测试结果。用这N个结果的平均值来测量模型的性能
如果LOD与K-fold—CV比较,LOD在N个样本上建立N个模型而不是k个,更进一步,N个模型的每一个都是在N-1个样本上训练的,而不是(k-1)n/k。两种方法中,假定k不是很大,且k<<N.LOD比k-fold-cv更加耗时
留p法验证
有N个样本,将每p个样本作为测试样本,其它N-p个样本作

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值