sklearn 学习之 model_selection

最新推荐文章于 2024-01-09 23:23:11 发布

weixin_38245062

最新推荐文章于 2024-01-09 23:23:11 发布

阅读量4.3k

点赞数

分类专栏： sklearn学习 model_selection 文章标签： sklearn model selection KFold

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38245062/article/details/80226458

版权

本文深入探讨了sklearn.model_selection.KFold，介绍了如何使用n_splits参数进行数据切分，以及shuffle和random_state选项在交叉验证过程中的作用。

摘要由CSDN通过智能技术生成

(1.1) sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)

这个数据分割器与之前学到的 GroupKFold()和GroupShuffleSplit() 有很大的不同，这个分割器既不要求我们对数据进行预先的分组（及运行split()函数是要求提供 groups 参数），也不让我们自行定义每次分割时test数据和train数据分别占总数据的比例（初始化GroupShuffleSplit()实例时传入的test_size和train_size参数）。只需我们简单的传入一个n_splits参数即可(如果要求分割时为随机采样数据进行分割，则需传入shuffle=true，默认为根据采样点出现的先后顺序连续的将数据分成 k 份，n_splits参数与 k-fold 中的 k 相对应）。调用KFold()实例的方法split()时，将数据平均分割为 k 份，每次取其中的一份作为 validation 数据，其余的 k-1 份作为训练数据，总共进行 k 次，每次都返回的为 train/validation 数据的下标。

example：

from sklearn.model_selection import KFold import numpy as np

x = np.aran

最低0.47元/天解锁文章

weixin_38245062

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。