sklearn 学习之 model_selection

本文深入探讨了sklearn.model_selection.KFold,介绍了如何使用n_splits参数进行数据切分,以及shuffle和random_state选项在交叉验证过程中的作用。
摘要由CSDN通过智能技术生成

(1.1) sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)

  这个数据分割器与之前学到的 GroupKFold()和GroupShuffleSplit() 有很大的不同,这个分割器既不要求我们对数据进行预先的分组(及运行split()函数是要求提供 groups 参数),也不让我们自行定义每次分割时test数据和train数据分别占总数据的比例(初始化GroupShuffleSplit()实例时传入的test_size和train_size参数)。只需我们简单的传入一个n_splits参数即可(如果要求分割时为随机采样数据进行分割,则需传入shuffle=true,默认为根据采样点出现的先后顺序连续的将数据分成 k 份,n_splits参数与 k-fold 中的 k 相对应)。调用KFold()实例的方法split()时,将数据平均分割为 k 份,每次取其中的一份作为 validation 数据,其余的 k-1 份作为训练数据,总共进行 k 次,每次都返回的为 train/validation 数据的下标。

example:
 
from sklearn.model_selection import KFold import numpy as np
x = np.aran
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值