对于欠拟合和过拟合的理解

zheliu_liuyi

已于 2023-06-13 17:01:04 修改

阅读量72

点赞数

文章标签：机器学习算法 python

于 2023-06-13 16:34:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zheliu_liuyi/article/details/131190271

版权

这两个概念都是针对训练集的

欠拟合就是你构建的模型太不符合训练集了,导致训练误差很大

过拟合就是你构建的模型符合训练集(不一定哈),而不符合测试集,导致泛化误差(测试误差)很大

这两个误差都与模型的函数空间有关(注意不是样本空间哈)

试想一下,假如为 $y=x^2$ 构建模型

你使用 $y=ax+b$ 模型来构建

你这样的函数空间一定小于最优的函数空间

你会发现你训练误差会很高,而且会随训练样本数增多而逐步增多(因为越接近真实,你的模型就越不合适)

这就是欠拟合

如果你用 $y=ax^9+bx^8+...+g$ 来构建

你会发现训练误差很低(因为参数很多,比较容易找到一种方案使所有点都在模型上,或者很靠近模型),但一旦换到测试样例,因为你不是专门针对测试样例构建的,那么某些你所构建的模型(毕竟系数很多,训练误差较低的模型可能不止一个)对于随机的可能情况,就可能表现的很差劲,如下图

模拟y=x^2

结果为:

当然也并非是容量越小,也不容易出现过拟合情况,过拟合和欠拟合并非是对立的情况,当容量很小时,过拟合一样会出现,如:

由于现实情况可能产生噪声,即使最优的模型y=x^2也一样与真实的y存在误差,这种误差称为贝叶斯误差

随着数据集的增大,对于低于最佳容量的模型,训练误差会逐渐增大(因为模型容量不足以反应其样例特点,其误差在样本很小时可能会被修正,但随着误差增大就越来越难找到一个满足所有的样例特定的模型了)，最终趋近于贝叶斯误差(数据过大会对模型进行一定的修正),而其测试误差就高于贝叶斯误差,毕竟你不能很好反映测试样例的特点

而最佳容量的模型,会随着数据集增大,训练误差几乎趋近于0,因为模型容量足以反应其样例的特点,且对贝叶斯误差具有一定的修正(毕竟你是根据这些数据建的模型),测试误差接近贝叶斯误差,因为模型容量足以反应其特点,但对于贝叶斯误差却没办法;

请注意,最优模型阶数(或者说函数空间)其实并不固定,是随着样本空间增大,整体趋于增大的,而对于任何固定容量的模型（在这里指的是二次模型）的训练误差都至少增至贝叶斯误差。

如图:

解决过拟合问题的一种思路:

添加偏好因素,在相同的误差下,更偏好于某些函数

如本题添加一个正则式,来进行调整

$J(w)=\mathrm{MSE}_{train}+\lambda\| W \|_\text{F}$

注意W的每一行表示不同阶数x向量的系数

当λ不等0时,会优先选取W整体较小的函数

效果:

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
对于欠拟合和过拟合的理解

随着数据集的增大,对于低于最佳容量的模型,训练误差会逐渐增大(因为模型容量不足以反应其样例特点,其误差在样本很小时可能会被修正,但随着误差增大就越来越难找到一个满足所有的样例特定的模型了)，最终趋近于贝叶斯误差(数据过大会对模型进行一定的修正),而其测试误差就高于贝叶斯误差,毕竟你不能很好反映测试样例的特点。请注意,最优模型阶数(或者说函数空间)其实并不固定,是随着样本空间增大,整体趋于增大的,而对于任何固定容量的模型（在这里指的是二次模型）的训练误差都至少增至贝叶斯误差。这两个概念都是针对训练集的。
复制链接

扫一扫

zheliu_liuyi CSDN认证博客专家 CSDN认证企业博客

码龄3年

10: 原创

142万+: 周排名

29万+: 总排名

2200: 访问

: 等级

117: 积分

1: 粉丝

2: 获赞

10: 评论

5: 收藏

私信

关注

热门文章

最新评论

修正《深入应用C++11代码优化与工程级应用》代码错误
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题为“修正《深入应用C++11代码优化与工程级应用》代码错误”，非常令人期待。不仅能发现并修复代码错误，还能分享给读者，这真是一项非常有价值的工作。希望您能持续创作，为我们带来更多优质的内容。在下一步的创作中，或许您可以考虑与读者更进一步互动，例如与读者分享您修正错误的思路和过程，或者提供一些实用的代码优化技巧。这样的分享将会更加丰富和深化读者对于C++11代码优化的理解，相信会对读者有更大的帮助。期待您的下一篇博客！
C++ 用宏+匿名类实现枚举
CSDN-Ada助手: 恭喜您写了第9篇博客！标题中的内容很有吸引力，引起了我的兴趣。使用宏和匿名类实现枚举的方法听起来很有趣，我期待着深入了解您在博文中的实现方式。您的持续创作真是令人钦佩，您对C++语言的研究和分享给读者带来了很多价值。在下一步的创作中，我建议您可以考虑深入探讨如何利用这种方法解决具体的实际问题，或者提供一些实用的示例代码，这样读者们可以更好地理解和运用这种技术。谢谢您的分享，期待您的下一篇博客！
类型特征提取
CSDN-Ada助手: 非常感谢你分享这篇关于类型特征提取的博客，对于程序员来说，掌握新技术和工具非常重要。除了C++11的静态类型检测，你可能也可以探索一下其他语言的类型特征提取，例如Java的反射机制和Python的类型注解。此外，还可以研究一下如何在实际项目中应用类型特征提取来提高代码的可读性和可维护性。期待你的更多精彩文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Deep Learning线性回归的讲解
CSDN-Ada助手: 非常感谢用户的分享，这篇关于Deep Learning线性回归的讲解非常有用！能够深入浅出地讲解复杂的技术问题，不仅对自己的学习有很大的帮助，也对广大读者有指导意义。希望用户能够继续坚持创作，分享更多的技术知识，让更多人受益。同时，也建议用户可以结合实际案例，对技术进行更深入的探讨，让读者更好地理解技术本质与实际应用。期待用户更多的创作！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
对于欠拟合和过拟合的理解
CSDN-Ada助手: 恭喜您写了这样一篇有关欠拟合和过拟合的博客，很有深度和启发性。您对这两个概念的理解非常到位，让人受益匪浅。我希望您能继续坚持创作，分享更多有关机器学习和人工智能的知识。下一步建议可以探讨一些实际应用中的例子，以及如何解决欠拟合和过拟合的问题。感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。