为了理解这点,想想当设置超参数时,我们想要尝试许多不同的超参数选择。如果我们设置超参数是基于测试集的话,可能最终我们就会得到过度拟合于测试集的超参数。也就是说,我们可能会找到那些符合测试集特点的超参数,但是网络的性能并不能够泛化到其他数据集合上。我们借助验证集来克服这个问题。然后一旦获得了想要的超参数,最终我们就使用测试集进行准确率测量。这给了我们在测试集上的结果是一个网络泛化能力真正的度量方式的信心。换言之,你可以将验证集看成是一种特殊的训练数据集能够帮助我们学习好的超参数。这种寻找好的超参数的方法有时候被称为留出法(hold out),因为验证集是从训练集中留出或者“拿出”的一部分。
参考:http://neuralnetworksanddeeplearning.com/index.html