训练集、验证集、测试集的划分依据

最新推荐文章于 2024-06-11 13:28:17 发布

不太冷的杀手

最新推荐文章于 2024-06-11 13:28:17 发布

阅读量1.3k

点赞数 1

分类专栏： TensorFlow CV 文章标签：深度学习机器学习人工智能

版权

13 篇文章 0 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

训练集毋庸置疑，是用于模型拟合的数据样本，用来调试网络中的参数。我们容易混淆的是验证集和测试集：验证集没有参与网络参数更新的工作，按理说也能用来测试网络的实际学习能力；测试集本来也能就是用来测试效果的，按理来说也能查看训练效果。

我们换个说法或者详细一些可能就会明白了：

验证集(validation set): 查看模型训练的效果是否朝着坏的方向进行。验证集的作用是体现在训练的过程。举个栗子：通过查看训练集和验证集的损失值随着epoch的变化关系可以看出模型是否过拟合，如果是可以及时停止训练，然后根据情况调整模型结构和超参数，大大节省时间。

测试集(test set): 用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。测试集的作用是体现在测试的过程。

对原始数据进行三个数据集的划分，也是为了防止模型过拟合。当使用了所有的原始数据去训练模型，得到的结果很可能是该模型最大程度地拟合了原始数据，亦即该模型是为了拟合所有原始数据而存在。当新的样本出现，再使用该模型进行预测，效果可能还不如只使用一部分数据训练的模型。

说到这里大家可能还会说，验证集没有参与网络参数更新的工作但是不能当测试集的原因还是没说啊，好，现在就来说一说。(下面的生动形象传神的比喻是Kieven2oo8提出的，博客我贴在了后面的参考里)

先来一个形象的比喻：

传统上，一般三者切分的比例是：6：2：2，验证集并不是必须的。

测试集为了具有泛化代表性，往往数据量比较大，所以往往只取测试集的其中一小部分作为训练过程中的验证集。当然有的论文中没有设置验证集也是可以的。

关注

专栏目录