KFold.split的使用

流觞时光

已于 2023-07-14 09:36:28 修改

阅读量750

点赞数 1

分类专栏：深度学习机器学习文章标签： python 机器学习 K折交叉验证深度学习 sklearn

于 2023-07-14 09:06:07 首次发布

本文链接：https://blog.csdn.net/qq_38574198/article/details/131715863

版权

深度学习同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

KFold.split是scikit-learn库中的一个工具，用于实现K折交叉验证。它将数据集分成K个部分，每次用K-1部分作为训练数据，剩余1部分作为验证数据，重复K次，确保每个部分都被用作验证一次。示例展示了K=5时的数据切分情况，强调了训练集和验证集的比例以及数据的随机洗牌选项。

摘要由CSDN通过智能技术生成

要实现K折交叉验证法有一个很方便的工具：KFold.split
其主要目的是替我们把数据划分为训练集和验证集，共划分K次(K折交叉验证的K)，每次的输出由两部分组成：[训练数据的索引，验证数据的索引]

from sklearn.model_selection import KFold

kf = KFold(n_splits=5,random_state=0,shuffle=True)

data = [['a'],['b'],['c'],['d'],['e'],['f'],['g'],['h']]

for d in kf.split(data):
    print(d)

输出为：

(array([0, 1, 3, 4, 5, 7]), array([2, 6]))
(array([0, 2, 3, 4, 5, 6]), array([1, 7]))
(array([1, 2, 4, 5, 6, 7]), array([0, 3]))
(array([0, 1, 2, 3, 4, 6, 7]), array([5]))
(array([0, 1, 2, 3, 5, 6, 7]), array([4]))