交叉验证(Cross Validation)
什么是交叉验证(Cross Validation)
交叉验证是一种模型验证技术,可用于评估统计分析(模型)结果在其他独立数据集上的泛化能力。它主要用于预测,我们可以用它来评估预测模型在实践中的准确度。
什么是泛化(Generalization)能力呢?
在《[Machine Learning] 回归(Regression)》中有提到,这里简单说明一下:
泛化能力通俗来将是指学习到的模型对未知数据的预测能力。
交叉验证(Cross Validation)的目的
在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。因此,为了得到可靠稳定的模型,使用交叉验证可以在使用模型进行预测时,准确衡量一个模型在实际数据集上的效果。
交叉验证(Cross Validation)的基本思想
在某种意义下把原始数据进行分组,一部分作为训练集(Training Data)<