交叉验证(Cross-Validation)的基本思想:
将原数据进行分组,一部分做为训练集,另一部分做为验证集,首先用训练集对不同参数的模型进行训练,再利用验证集来测试训练得到的模型,进而用验证集的测试误差来衡量模型中的参数。
常用的交叉验证的方法:
( 1) Hold-out 方法
Hold-out 方法即将原数据随机的分成两组,一组用作训练数据集,另一组用作验证数据集。
训练集训练模型,验证集则用于验证训练得到的模型,验证集的测试误差则为衡量标准。
Hold-out 方法依赖于单一的数据分割,并没有出现数据的交叉。实验结果高度依赖数据集的分割,验证结果容易出现不稳定的