在评估训练的模型时,如何准确评估模型的性能?从数据的角度来出发。
如果数据的量比较多的化,自然是评估模型比较准确的。但是如果数据的量比较少的话,那么如何用这些少的数据量(就自然具有偶然性,评估的模型也就偏向于这个可能的偶然性,那么这样评估的模型自然就是不准确的)来评估模型的性能呢?
数据量比较少的话,那就充分利用现有的数据进行评估,来避免数据所带来的偶然性。
采用的一种方法叫做K折交叉验证法(留一法):
一般把数据分成十份,依次取其中的一份作为测试集(验证集)来评估由剩下的九份作为训练集所训练的模型的性能,测试的结果就表示这个模型在当前所分的数据下的性能指标,当然这样重复十次,最后取十次的平均值来作为由这组数据所评估的模型的性能指标。
如果我们的数据量比较多时,是没必要采用这种方法的,会运行很慢。