本文结构:
- 什么是交叉验证法?
- 为什么用交叉验证法?
- 主要有哪些方法?优缺点?
- 各方法应用举例?
什么是交叉验证法?
它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。
为什么用交叉验证法?
- 交叉验证用于评估模型的预测性能,尤其是训练好的模型在新数据上的表,可以在一定程度上减小过拟合。
- 还可以从有限的数据中获取尽可能多的有效信息。
- 可以选择出合适的模型
主要有哪些方法?
- Holdout Method
- K-Fold CV
- Leave One out CV
- Bootstrap Methods
1. 留出法 (holdout cross validation)
这种方法是最简单的交叉验证:
在机器学习任务中,拿到数据后,我们首先会将原始数据集分为三部分:训练集、验证集和测试集