k折交叉验证原理:
k折交叉验证是将数据分为k份,选取其中的k-1份为训练数据,剩余的一份为测试数据。k份数据循环做测试集进行测试。此原理适用于数据量小的数据。
# k-折交叉验证(此处设置k=10)
from sklearn import datasets
from sklearn.model_selection import KFold
iris = datasets.load_iris()
data, target = iris.data, iris.target
kf = KFold(n_splits = 10, shuffle=True, random_state=0) # 10折
for train_index, test_index in kf.split(data): # 将数据划分为k折
train_data = data[train_index] # 选取的训练集数据下标
test = data[test_index] # 选取的测试集数据下标