深度学习基础之过拟合

最新推荐文章于 2022-10-20 00:28:59 发布

陈小虾

最新推荐文章于 2022-10-20 00:28:59 发布

阅读量721

点赞数

分类专栏：机器学习深度学习文章标签：过拟合欠拟合深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ch18328071580/article/details/98444009

版权

文章目录

一、基本概念
二、产生过拟合的原因
三、缓解过拟合

一、基本概念

1）方差和偏差

偏差：偏差度量了学习算法的期望预测与真实结果的偏离程度, 即刻画了学习算法本身的拟合能力。
方差：方差度量了同样大小的训练集的变动所导致的学习性能的变化, 即刻画了数据扰动所造成的影响。

我们总是希望选择低偏差和低方差的模型，但是偏差和方差在一定程度上是矛盾的。如果偏差降低，那方差可能会相应的升高，如果方差降低，那偏差可能相应升高。所以我们是尽量的寻求偏差和方差的一个平衡点。

下图比较形象的表达偏差和方差的含义：
在这里插入图片描述
可以看到，偏差越大，点集整体越脱离靶心；而方差越大，点集整体越离散。

2）欠拟合与过拟合

欠拟合（Underfit）：也被称为high bias，模型的经验误差大，模型太简单，在训练的过程中基本没学到有价值的内容，说明模型欠拟合。
过拟合（Overfit）：也被称为high viarance，模型学习了太多的训练样本的“个性”（经验误差小），但是对于未知的样本泛化能力差（泛化误差大），说明过拟合。

下图比较形象的表达欠拟合和过拟合的含义：
在这里插入图片描述
也可以通过学习曲线来识别模型是否发生了欠拟合、过拟合。

如下图所示：横轴为训练样本数量，纵轴为误差
在这里插入图片描述
模型欠拟合时，在训练集以及测试集上同时具有较高的误差，此时模型的偏差较大；模型过拟合时，在训练集上具有较低的误差，在测试集上具有较高的误差，此时模型的方差较大。模型正常时，在训练集以及测试集上，同时具有相对较低的偏差以及方差。

可以发现：当模型欠拟合的时候，我们发现增大训练集，偏差无法降低，无法解决欠拟合问题；当模型过拟合的时候，我们发现增大训练集，方差减小，可以解决过拟合问题。

3）经验风险和结构风险

经验误差：模型关于训练样本集的平均误差（也称经验风险）。
结构风险：结构风险在经验风险的基础上加上表示模型复杂度的正则化项。

虽然可以使用经验损失近似估计期望风险，但是大数定理的前提是N无穷大，实际上，我们的训练集一般不会特别大，此时就需要对经验风险做出适当调整才能近似估计。因此引入结构风险。
结构化风险是为了缓解数据集过小而导致的过拟合现象，其等价于正则化，本质上反应的是模型的复杂度。认为经验风险越小，参数越多，模型越复杂，因此引入对模型复杂度的惩罚机制。公式如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础之过拟合

过拟合是深度学习中不可避免的一个问题，本文介绍了方差和偏差，欠拟合和过拟合，以及产生过拟合的原因。最后给出了如果减缓过拟合的方法。
复制链接

扫一扫

专栏目录

陈小虾 CSDN认证博客专家 CSDN认证企业博客

码龄8年

91: 原创

23万+: 周排名

63万+: 总排名

29万+: 访问

: 等级

3281: 积分

215: 粉丝

376: 获赞

42: 评论

2848: 收藏

私信

关注

热门文章

分类专栏

最新评论

生成对抗网络GAN详细推导
adequate_: 想问一下在GAN的训练这一部分中，博主写的在更新G的时候，不要更新G太多是为什么呀？有点没看懂前面的解释
支持向量机SVM、支持向量回归SVR详细推导
weixin_44292399: 写的真的是太好了，从SVM到核再到SVR都十分系统，并且循序渐进
产品经理之产品类题目
CSDN-Ada助手: 非常感谢CSDN博主的分享，产品经理的产品类题目确实是一个重要的话题。我觉得下一篇你可以写一篇关于“用户需求分析”方面的技术博文，介绍如何通过市场调研、用户访谈等方式深入了解用户需求，从而更好地制定产品策略。这样的技术文章对其他用户也会非常有帮助，相信会有更多读者受益。期待你的下一篇精彩分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
推荐系统评测
百里晨露: 请问博主这条博客有论文支撑吗
生成对抗网络GAN详细推导
YDXHH_: kl散度应该都为概率，应该是为了把两个概率和凑到[0,1]区间多乘了两个log1/2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。