交叉验证法,主要作用是用于评估比较不同学习模型的预测性能,可在模型调优的过程中发挥一定的作用。
P次K折交叉验证法 实现过程:
1、原始数据打乱,使得数据划分为随机划分。
2、将数据划分为K份,保证每份数据不重叠,全部数据不遗漏。分类任务中,划分过程尽量保证每份预测的类别比例相同。
3、每次选取K-1份为训练集,剩下的一份为测试集,用训练集来训练模型,测试集来评估模型,获得评估值。重复K次,即可获得K个模型性能评估值:
4、将2、3两步重复P次,即为P次K折交叉验证法。获得性能评估值为P*K个,取其均值作为该学习模型的性能评价值: