0、介绍
Berrar D. Cross-Validation[J]. 2019.
交叉验证是一种数据重采样方法,以评估预测模型的泛化能力和防止过拟合。与 bootstrap 一样,交叉验证也属于蒙特卡罗方法的家族。本文介绍了交叉验证及其相关的重采样方法。
从概念上讲,预测模型 f() 是基于数据集 D 为一个案例分配一个类标签的规则,即 ,其中
是案例
的预测类标签。在机器学习中,这种模型的构造被表示为监督学习。
在监督学习中的一个中心问题是关于结果模型的准确性。这里的一个关键问题是过拟合。例如,考虑一个单变量回归问题,我们希望从基于n个观测点