1. 交叉验证:交叉验证(Cross-validation)主要用于建模应用中,例如PCR 、PLS 回归建模中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。
2. k折交叉验证就是将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。
纽约大学博士Seymour Geisser提出K折交叉验证法,具体步骤如下:
1)将数据集D随机分为k个包(这里假定K=6);
2)每次将其中一个包作为测试集test,剩下k-1个包作为训练集train进行训练;
3)最后计算k次求得的分类率的平均值,作为该模型或者假设函数的真实分类率;
3. 10折交叉验证举例
第1步,将数据等分到10个桶中。