训练集，验证集，测试集，K折交叉验证

最新推荐文章于 2023-11-23 10:56:03 发布

李大牛子

最新推荐文章于 2023-11-23 10:56:03 发布

阅读量1.9k

点赞数 7

文章标签：机器学习深度学习神经网络数据挖掘

本文链接：https://blog.csdn.net/weixin_41653557/article/details/112369096

版权

参数

有了模型后，训练集就是用来训练参数的，说准确点，一般是用来梯度下降的。而验证集基本是在每个epoch完成后，用来测试一下当前模型的准确率。因为验证集跟训练集没有交集，因此这个准确率是可靠的。那么为啥还需要一个测试集呢？

这就需要区分一下模型的各种参数了。事实上，对于一个模型来说，其参数可以分为普通参数和超参数。在不引入强化学习的前提下，那么普通参数就是可以被梯度下降所更新的，也就是训练集所更新的参数。另外，还有超参数的概念，比如网络层数、网络节点数、迭代次数、学习率等等，这些参数不在梯度下降的更新范围内。尽管现在已经有一些算法可以用来搜索模型的超参数，但多数情况下我们还是自己人工根据验证集来调。

所以train、test、valid区别

那也就是说，从狭义来讲，验证集没有参与梯度下降的过程，也就是说是没有经过训练的；但从广义上来看，验证集却参与了一个“人工调参”的过程，我们根据验证集的结果调节了迭代数、调节了学习率等等，使得结果在验证集上最优。因此，我们也可以认为，验证集也参与了训练。

那么就很明显了，我们还需要一个完全没有经过训练的集合，那就是测试集，我们既不用测试集梯度下降，也不用它来控制超参数，只是在模型最终训练完成后，用来测试一下最后准确率。
算法选择具有最小泛化误差的模型作为最终模型，并且在整个训练集上再次训练该模型，从而得到最终的模型。

折交叉验证

首先它是在验证阶段起作用的，所以K折交叉验证的作用是选择模型的超参用，而不是参与训练决定模型的权重阈值。它是为了防止随意划分的验证集存在分布上的偏差导致误判，从而选择了局部最优的超参，而不是全局最优。为什么一些异常检测，CTR之类的非均衡问题用到这个手段，就是应为样本不均衡，随意划分会导致分布不均，比如所验证集合里面就一个正样本，那指标就一定是极端的。K折之后可以避免这种情况，便于我们更好的选择模型超参。

李大牛子

关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
训练集，验证集，测试集，K折交叉验证

参数有了模型后，训练集就是用来训练参数的，说准确点，一般是用来梯度下降的。而验证集基本是在每个epoch完成后，用来测试一下当前模型的准确率。因为验证集跟训练集没有交集，因此这个准确率是可靠的。那么为啥还需要一个测试集呢？这就需要区分一下模型的各种参数了。事实上，对于一个模型来说，其参数可以分为普通参数和超参数。在不引入强化学习的前提下，那么普通参数就是可以被梯度下降所更新的，也就是训练集所更新的参数。另外，还有超参数的概念，比如网络层数、网络节点数、迭代次数、学习率等等，这些参数不在梯度下降的更新范围
复制链接

扫一扫