训练集验证集测试集简析

最新推荐文章于 2024-08-27 17:38:33 发布

jp_666

最新推荐文章于 2024-08-27 17:38:33 发布

阅读量2.6k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jp_666/article/details/78243144

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在机器学习的监督学习中，经常提到训练集合测试集，验证集似有似无。今天无意间看到一篇博客，提到了验证集，感觉挺好奇的，就仔细查找了文献。以下谈谈训练集、验证集和测试集的区别。

在监督学习中，首先需要一个训练集，这个训练集是有标记的数据，用于训练一个最佳的模型。训练集中的数据需要使用均匀随机抽样的方式从样本集中选取数据。而验证集合测试集都是为了检测得到的模型是不是够好而创建的，这两个数据集也需要数据均匀分布，并且最好与训练集中的数据没有交集，另外这三个数据集应该是独立同分布的。

当确定使用什么模型进行训练之后，就可以使用训练集进行训练了，当训练完成之后，就需要使用验证集验证模型的准确率。就拿线性回归来说，训练过程中要不断的使用梯度下降算法，每次得到一个确定的中间模型就需要使用验证集验证一次模型的准确率。

既然说，验证集已经可以验证模型的准确率了，那么测试集又可以发挥什么作用呢？在机器学习中，有一些算法中的参数在训练过程中是无法体现的，也就是说不能由验证集的验证过程直接反映出模型是否合适，还需要后续的验证，这时候就需要使用测试集。

再说仔细点就是，在构建模型的过程中，参数可以分为两类，一类是普通参数、一类是超参数。普通参数就是上面那种可以在训练过程中不断更新的，而超参数是人为引入的，存在一定的人为因素，在训练过程启动之后就不能改变的参数。比如：神经网络中的网络层数、迭代次数和学习率等。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。