交叉验证 1. 一个train 一个test 大多数统计方法都是这么干的 2. n折交叉验证 所有数据都有机会被验证,得到的模型更具有稳健性,且是在折内进行建模。 只是方差偏差权衡的上面一部分(只是在train中建好了模型,test集不参与) 回归的n折交叉验证—— 计算MSE的值 分类的n折交叉验证——计算准确率 3. 留一法 相当于n折内只有一个观测样本,是n折交叉验证的特例。 通常被用来判断是否为异常值,因为该值不参与模型