为什么除了训练集要划分测试集和验证集

最新推荐文章于 2023-12-05 17:10:55 发布

spider_fu

最新推荐文章于 2023-12-05 17:10:55 发布

阅读量1.1k

点赞数

分类专栏：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fuzizhu1/article/details/117601307

版权

笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文探讨了在人工智能模型训练中，数据集的合理划分对于模型选择和性能评估的关键作用。通常，数据集被分为训练集、验证集和测试集，比例如3:1:1。训练集用于训练模型，验证集帮助选择最佳模型，而测试集则用于独立评估模型的泛化能力。确保验证集和测试集不重合，能有效避免过拟合，真实反映模型在未知数据上的表现。

摘要由CSDN通过智能技术生成

假设有1000条已经标注好的数据，取其中600条作为训练集，200条作为验证集，200条作为测试集。
3：1：1的比例可以自行调整，三个集合互相不存在交集
训练集作用：设计好的模型通过训练集最优化后的一个集合
验证集作用：通过验证集去选择上一个集合中的最优模型
测试集作用：通过测试集评估选出来的模型的性能
原因：
如果测试集和验证集是同一个集合，或者说同时用一个集合去做模型的选择和模型的评估是没有意义的，因为同一个数据集上选择出来的模型在同一个数据集上表现一定是和先前一样最优的。而我们想要的是模型的泛化能力，即样本外的情况，因此要划分为两个数据集。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。