模型评估与模型参数选择之验证

uu1224

于 2024-03-07 22:48:08 发布

阅读量344

点赞数 3

文章标签：人工智能算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77681528/article/details/136548225

版权

模型不能过拟合于训练集，否则将不能在测试集上得到最优结果；但是否能直接以测试集上的表现来选择模型参数呢？

答案是否定的。因为这样的模型参数将会是针对某个特定测试集的，得出来的评价标准将会失去其公平性，失去了与其他同类或不同类模型相比较的意义。

因此参数的选择（即调参）必须在一个独立于训练集和测试集的数据集上进行，这样的用于模型调参的数据集被称为开发集或验证集。

然而很多时候我们能得到的数据量非常有限。这个时候我们可以不显式地使用验证集，而是重复使用训练集和测试集，这种方法称为交叉验证。

常用的交叉验证方法有：

1.简单交叉验证。

2.K-重交叉验证。

1。交叉验证

留出法（Holdout cross validation）按照固定比例将数据集静态的划分为训练集、验证集、测试集。

自组法（bootstrapping）适合于样本数目较少，有放回的取法

2.k 折交叉验证

k 折交叉验证（k-fold cross validation）：

k 一般取 10

将数据集分为训练集和测试集，将测试集放在一边

将训练集分为 k 份每次使用 k 份中的 1 份作为验证集，其他全部作为训练集。

通过 k 次训练后，我们得到了 k 个不同的模型。

评估 k 个模型的效果，从中挑选效果最好的超参数

使用最优的超参数，然后将 k 份数据全部作为训练集重新训练模型，得到最终模型

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

uu1224 CSDN认证博客专家 CSDN认证企业博客

码龄1年

23: 原创

122万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

510: 积分

252: 粉丝

275: 获赞

14: 评论

283: 收藏

私信

关注

热门文章

最新评论

idea
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
PyTorch深度学习基础之Reducation操作和PyTorch自动微分
CSDN-Ada助手: 恭喜作者发布了第18篇博客，涉及PyTorch深度学习基础中的Reducation操作和PyTorch自动微分，内容十分丰富深入。希望作者能够继续坚持创作，分享更多有关PyTorch深度学习的知识和经验。建议下一步可以探讨PyTorch在图像处理或自然语言处理领域的应用，相信会为读者带来更多启发和帮助。期待作者的下一篇作品！
Logistic回归
CSDN-Ada助手: 恭喜您发布了关于Logistic回归的第19篇博客！持续创作是非常不容易的，您的努力和热情让读者受益匪浅。希望您可以继续保持写作的热情，探索更多关于机器学习的内容，也可以考虑分享一些实践经验或者案例分析，这样可以更好地帮助读者理解和运用相关知识。期待您的下一篇作品！祝您写作顺利！
Logistic回归
CSDN-Ada助手: 恭喜作者在博客领域迈出了第20步，标题为“Logistic回归”的文章内容也相当精彩。希望作者能够继续保持创作的热情和耐心，不断挖掘更多领域的知识，为读者带来更多有价值的内容。建议下一篇博客可以围绕“神经网络”的主题展开，相信作者一定能够有更深入的见解和独特的观点。期待您的下一篇作品！
Caffe、TensorFlow、PyTorch三者比较
ha_lydms: 作者的文字总是能够打动我的心灵，让我感到内心温暖和安慰。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。