交叉验证方法一般应用在训练集数量较小(因此验证集的数量更小)的情况下。例如5折法/10折法。
如之前KNN博客所说,KNN中K为其中一个超参,以该算法为例,我们就可以应用交叉验证的方法来选取K值。
下图为5折法图例。
每当选取一个K值,如K=3,我们将数据集等分成五份,其中循环的将这五份分别作为验证数据集,其余四份作为训练数据集。然后,将五份的验证结果取平均,用以说明K=3时的性能。最后比较不同K值下accuracy的值,从而确定K的取值
交叉验证方法一般应用在训练集数量较小(因此验证集的数量更小)的情况下。例如5折法/10折法。
如之前KNN博客所说,KNN中K为其中一个超参,以该算法为例,我们就可以应用交叉验证的方法来选取K值。
下图为5折法图例。
每当选取一个K值,如K=3,我们将数据集等分成五份,其中循环的将这五份分别作为验证数据集,其余四份作为训练数据集。然后,将五份的验证结果取平均,用以说明K=3时的性能。最后比较不同K值下accuracy的值,从而确定K的取值