机器学习中,经常会将数据划分为训练集、验证集和测试集,常见比例是8:1:1,也可根据需要进行调整。
训练集:顾名思义,是对模型进行训练,一般是用来梯度下降的,得到模型的参数(不是超参数)。
验证集:一般是在每个epoch完成后,用来测试当前模型的准确率。验证集跟训练集没有交集,因此这个准确率是可靠的。但是,验证集参与了一个“人工调参”的过程,根据验证集的结果可以调节迭代次数、学习率等超参数,使模型的结果在验证集上最优,可以认为,验证集也参与了模型的训练。
测试集:一个没有参与模型训练过程的数据集,既不用它进行梯度下降,也不用它来调整超参数,只是在模型训练完成后,用来测试模型的准确率。