SKLEARN模型选择

最新推荐文章于 2024-07-25 21:45:20 发布

林淮荣

最新推荐文章于 2024-07-25 21:45:20 发布

阅读量1.2k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43663780/article/details/105813245

版权

本文介绍了SKLEARN中的模型选择方法，包括K折交叉验证、留一法、随机划分法等数据集划分策略，以及网格搜索和随机采样等超参数优化技术。此外，还探讨了模型验证方法，如学习率曲线的绘制，以及评估模型性能的score方法和scoring参数的使用。

摘要由CSDN通过智能技术生成

数据集划分方法

在这里插入图片描述

K折交叉验证法

将全部训练集S分成k个不相交的子集，假设S中的训练样例子数为m，那么每一个子集有m/k个训练样例，相应子集称作{s1,s2……sk}
每次从分好的子集里面，拿一个作为测试集，其他k-1作为训练集
在k-1个训练集中训练出学习器模型
把这个模型放到测试集上，得到分类率
计算k次求得的分类率的平均值，作为改模型或者假设函数的真实分类率
这个方法充分利用了所有样本，但计算比较繁琐，需要训练k次，测试k次

留一法

假设有N个样本，将每一个样本作为测试样本，其它N-1个样本作为训练样本，这样得到N个分类器，N个测试结果。用这N个结果的平均值来测量模型的性能
如果LOD与K-fold—CV比较，LOD在N个样本上建立N个模型而不是k个，更进一步，N个模型的每一个都是在N-1个样本上训练的，而不是（k-1）n/k。两种方法中，假定k不是很大，且k<<N.LOD比k-fold-cv更加耗时
留p法验证
有N个样本，将每p个样本作为测试样本，其它N-p个样本作

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。