【机器学习】040_理解偏差与方差

最新推荐文章于 2024-07-12 15:56:49 发布

Cyan.__

最新推荐文章于 2024-07-12 15:56:49 发布

阅读量185

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能 python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yukiice/article/details/134912509

版权

机器学习专栏收录该内容

45 篇文章 1 订阅

订阅专栏

一、定义

偏差：衡量预测值与真实值之间的关系——指预测值和真实值之间差值

方差：衡量预测值之间的关系，与真实值无关——指各个预测值之间的离散程度

误差 = 偏差 + 方差

· 高偏差——模型欠拟合；

· 高方差——模型过拟合；

训练模型时，既要避免高偏差，又要避免高方差。

可以利用如下图所示的打靶模型更好地理解偏差和方差：

二、学习曲线（反映模型出于偏差还是方差）

通过学习曲线，将训练集误差和交叉验证集误差作为训练集实例数量（m）的函数，绘制图表反映

· 当模型欠拟合时，训练误差和交叉验证误差都较大，且在增大到一定程度后趋于平坦。这两部分的误差值往往是大于human level performance的。增加数据集的数据量，往往不会有太大帮助。

· 当模型过拟合时，训练误差较小（精度很高），但是交叉验证误差较大。通过增加数据集大小，使用更多数据，可以有效减小交叉验证误差。因而，提高数据量有助于解决过拟合。

因而，通过数据量增大对模型精度的影响，可以间接反映出模型误差是出于偏差还是方差。

三、解决高偏差与高方差

高偏差:

1. 增加特征

获得更多的特征

增加多项式特征

2. 减少正则化程度

高方差:

1. 增加训练数据

2. 减少特征数量

3. 增大正则化程度

事实证明，大型神经网络是低偏差模型机器，换句话说，神经网络越大越能适配训练数据集；

因此，通过以下循环，可以不断解决高偏差和高方差：

· 首先将模型在训练集上训练，看训练误差的大小；如果训练误差过大就使用更大的神经网络，知道训练误差足够小为止。构建更大的神经网络，往往需要消耗GPU算力。

· 然后在交叉验证集上训练模型获得交叉验证误差。如果交叉验证误差过大则增大数据量，再次返回最初重新进行循环，不断进行直到交叉验证误差也足够小为止。获取更多的数据量，往往需要大量原始数据和访问大量数据应用的支撑。

事实证明，具有良好正则化的大型神经网络通常与较小的神经网络一样好或更好——适当地对大型神经网络进行正则化，就能够减小过拟合现象的发生。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
【机器学习】040_理解偏差与方差

【学习笔记】机器学习_040：理解偏差与方差，理解学习曲线，认识解决高偏差与高方差的方法。
复制链接

扫一扫

专栏目录

Cyan.__ CSDN认证博客专家 CSDN认证企业博客

码龄2年

47: 原创

41万+: 周排名

8万+: 总排名

9194: 访问

: 等级

506: 积分

23: 粉丝

34: 获赞

15: 评论

38: 收藏

私信

关注

热门文章

分类专栏

Linux 1篇
机器学习 45篇
C++ 1篇

最新评论

【机器学习】044_Kaggle房价预测（机器学习模型实战）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【机器学习】040_理解偏差与方差
白话机器学习: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
【机器学习】041_模型开发迭代过程
白话机器学习: 内容丰富图文并茂，认真看完收获很大。思路清晰细节满满，支持大佬优质好文。
【机器学习】019_缺失值处理
CSDN-Ada助手: 恭喜你写完了第20篇博客！标题看起来非常有意思，关于缺失值处理的内容一定会对读者有所帮助。你在机器学习领域的持续创作让人佩服，真的很高兴看到你的进步。在下一步的创作中，或许可以考虑分享一些关于特征选择或者模型评估的技巧，这些主题也是非常受欢迎的。再次恭喜你，并期待你未来更多博客的发布！
【机器学习】001_监督学习与非监督学习
CSDN-Ada助手: 非常恭喜你开始了博客创作的旅程！标题看起来非常有吸引力，机器学习的内容一直备受关注。监督学习与非监督学习是机器学习中的两个重要概念，期待你能够深入探讨这两个主题，给读者带来更多的见解和启发。在下一步的创作中，或许可以考虑介绍一些具体的监督学习和非监督学习的算法或示例，这样读者能够更好地理解它们的应用和区别。再次祝贺你的第一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。