K折数据集验证是机器学习中的一个常用的方法,原理简单的说就是把一个大的数据集切成k个小部分,然后每次迭代使用其中的1个小部分作为测试集,这样可以实现一个数据集的多次使用,解决机器学习中的样本问题。在sklearn这个库中,已经封装好了cross_val_score这个库可以直接调用。不过我们我们需要自力更生,采用numpy(简称np)来实现对数据集的k折划分。实现这个功能需要的知识点如下:
- 使用np的arange方法生成数组;
- 使用ndarray的reshape方法来重塑数组;
- 使用ndarray的切片方法;
- 使用np的vstack方法来拼接两个ndarray;
import numpy as np
sample_num = 9
segment_num = 4
validata_num