机器学习——训练集、验证集、测试集

最新推荐文章于 2024-09-24 17:09:00 发布

JiaShengLiu111

最新推荐文章于 2024-09-24 17:09:00 发布

阅读量2.9k

点赞数

分类专栏： ML 数据集划分

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liu111111113/article/details/81545099

版权

ML 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

数据集划分

2 篇文章 0 订阅

订阅专栏

为什么要将数据集分为训练集、验证集、测试集三部分？

对于很多机器学习的初学者来说，这个问题常常令人很迷惑，特别是对于验证集和测试集的区别更让人摸不到头脑。

下面，我谈一下这三个数据集的作用，及必要性：

训练集：显然，每个模型都需要训练集，训练集的作用很明显，就是直接参与模型的训练过程。

测试集：测试集完全不参与训练，就是说模型的产生过程和测试集是完全没有关系的。之所以要求测试集和模型的产生过程完全没有关系，是因为测试集的作用就是验证模型的泛化能力，只有测试集完全不参与模型的产生过程，测试集才能够有效的衡量模型的泛化能力。

验证集：为什么需要验证集呢？很多时候我们通过训练集训练出一个模型，我们想知道该模型的泛化能力怎么样呢？同时我们想根据该模型的泛化能力再反过来调节模型的参数（例如：调节超参数，或者重新训练模型等）。因此，我们需要一个没有直接参与模型训练过程的数据集来评估模型的泛化能力，但是显然该数据集不能是测试集，因为测试集要求完全不参与模型的产生过程，但是我们需要的这个数据集显然参与了模型的产生过程（根据模型在该数据集上的性能表现反过去调整模型的相应参数）。所以验证集就应运而生。

我们常最迷惑的地方就是验证集的作用，总结来说，验证集不直接参与训练过程，但是其参与了模型的产生过程。它是模型调优过程中的关键数据集。

在我看来，任何一个规范的模型训练过程，都需要这三个数据集，因为任何模型都需要训练集；训练出来的模型都需要一个调优的过程（通常不可能你一次训练出的模型就一定有很好的性能表现），因此都需要验证集；在验证集上模型调优结束之后，都需要一个测试集来最终检验模型的性能。（记住，测试集不用于模型的调优，它仅仅是测试最终模型的性能而已，即不能根据测试集的表现再返回去修改模型参数，因为一旦你这么做了就很可能会过拟合测试集，那么测试集也就失去了它存在的意义了）。

在学习过程中参考了一篇论文：https://arxiv.org/abs/1806.00451。该论文对于测试集的作用有着深刻的见解。

如上是我个人在学习过程中的认识和总结，我认为肯定是有不妥和偏差之处，希望多多批评指教！

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JiaShengLiu111 CSDN认证博客专家 CSDN认证企业博客

码龄10年

12: 原创

34万+: 周排名

68万+: 总排名

10万+: 访问

: 等级

1102: 积分

6: 粉丝

63: 获赞

7: 评论

160: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习——什么时候需要显式的划分出“验证集”
是谁在学习: 感觉作者的思路不错，讲清楚了两种思路的区别，而且我也同意第二种更合适的说法。
分类器评估方法：准确率和混淆矩阵
慢慢来的小邵: 作者那么常用的代替准确率的是哪个率呢
python报错：ordinal not in range(128)解决方案
老王笔记: 解决了，谢谢楼主
Docker的容器创建以及基本命令
一只正在修炼的小猪: 我本地有镜像，但是运行docker run -i -t 镜像名字 /bin/bash时，它直接去仓库找呢？返回的时仓库张没有该镜像。
opencv程序每次运行结果不一致问题
XSD995366159: 还有一个问题是程序中数据类型的转换，或者统一问题。我在一段程序中用了double和float混用了，造成低精度向高精度的转换出现误差，直接导致每次计算结果可能不一样。另外我发现我有一个参数的取值在1.1时就会出现每次运行结果可能不一样的情况，把参数改成1.2实验多次并未出现不一样的运行结果，这里没搞清楚，玄学～～

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。