(1.1) sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)
这个数据分割器与之前学到的
GroupKFold()和GroupShuffleSplit() 有很大的不同,这个分割器既不要求我们对数据进行预先的分组(及运行split()函数是要求提供 groups 参数),也不让我们自行定义每次分割时test数据和train数据分别占总数据的比例(初始化GroupShuffleSplit()实例时传入的test_size和train_size参数)。只需我们简单的传入一个n_splits参数即可(如果要求分割时为随机采样数据进行分割,则需传入shuffle=true,默认为根据采样点出现的先后顺序连续的将数据分成 k 份,n_splits参数与 k-fold 中的 k 相对应)。调用KFold()实例的方法split()时,将数据平均分割为 k 份,每次取其中的一份作为 validation 数据,其余的 k-1 份作为训练数据,总共进行 k 次,每次都返回的为 train/validation 数据的下标。
example:
from sklearn.model_selection import KFold import numpy as np
x = np.aran