交叉验证的方法 留一验证 解释: 只从可用的数据集中保留一个数据点,并根据其余数据训练模型。此过程对每个数据点进行迭代,比如有n个数据点,就要重复交叉验证n次。例如下图,一共10个数据,就交叉验证十次 图示如下: 优点 适合数据集量级较小 因为利用了所有的数据点,因此偏差比较低 缺点 因为重复执行验证,执行时间比较长 因为是数据点进行验证,如果数据点是离群值,那么模型的准确度就会大大受到影响 K折交叉验证 1.解释: 进行多次train_test_split划分;每次划分时,在不同的数据集上进行训练、测试评估,从而得出一个评价结果;如果是5折交叉验证,意思就是在原始数据集上,进行5次划分,每次划分进行一次训练、评估,最后得到5次划分后的评估结果,一般在这几次评估结果上取平均得到最后的评分 图示如下: