机器学习：方差(variance)和偏差(bias)

最新推荐文章于 2023-05-21 16:45:36 发布

strive_1106

最新推荐文章于 2023-05-21 16:45:36 发布

阅读量1k

点赞数 2

分类专栏：机器学习理论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huangjin_1995/article/details/83449302

版权

机器学习理论专栏收录该内容

8 篇文章 0 订阅

订阅专栏

模型误差来源

机器学习模型的泛化误差来自于两方面：error=viriance+bias

偏差：通过n次采样，每次采样m个训练样本，训练模型，这样可以得到n个模型，每个模型输出的平均值与真实模型的输出之间的差值。

方差：通过n次采样，每次采样m个训练样本，训练模型，这样可以得到n个模型，每个模型输出的方差。

那么什么情况下偏差大呢，什么情况方差大？

假设在1阶，3阶，5阶模型空间上，我们分别训练了100个模型(n=100)，得到的曲线如上图所示。假设真实模型为：

画出所有模型的输出平均值和真实值的对比曲线：

就bias而言，可以看出对于左边模型较为简单的一阶模型，bias更大，而右边5阶模型的bias则很小

可以得出一个结论：模型越简单，偏差越大。从模型空间角度出发看，模型越简单，它能覆盖的函数空间越小，那么它能包含真实模型的概率就越小，因此偏差越大。

就variance而言，可以看出越简单的模型，曲线越集中；越复杂的模型，曲线越分散

可以得出一个结论：模型越简单，方差越小；模型越复杂，方差越大。从另一个角度看：模型越简单，它越不受样本的影响，比如我们都用常数模型f(x)=c拟合，那么此时偏差为0。

variance-bias trade-off

由上面的分析可以看出，随着model的复杂性上升，由bias带来的error是不断减小的；由variance带来的error是不断增加的，那么必然在两者之间存在一个平衡点，在该点的model性能最好。如下图所示：

当模型太过简单(在trade-off点之前)，这个时候bias会过于大，造成欠拟合；当模型太过复杂(在trade-off点之后)，这个时候variance会过于大，造成过拟合；

如何在实际问题中消除bias和variance

如果是bias很大，说明模型太简单了，甚至连train data都没办法fit很好；这个时候只能从模型角度出发，增加模型的复杂度，或者增加有用的特征，让简单的model就能fit好；

如果是variance很大，模型太过复杂，可以考虑增加数据集(实际中不好操作);或者通过正则化(Regularization)降低模型的复杂度，但这个有可能会是的bias增加。

从另一个角度看overfitting和underfitting

经验风险：模型在训练集上的误差。

overfitting就是不断最小化经验风险，只要模型足够复杂，就可以使得在训练集上的误差越来越小。而实际上在随着模型不断的复杂，它在测试集上的误差是先减小后增大的，那么那个拐点其实就那个trade-off。平衡点表现为训练误差不是很大(没有underfitting),测试集误差也没有很大(没有overfitting)。

underfitting是指模型过于简单，使得经验风险(训练集误差)过高。

从这个角度上看，我们实际上不仅要最小化经验风险，还要最小化模型复杂度，这两者的和其实就是结构风险。

我们可以通过模型选择来防止overfitting，模型选择包括正则化和交叉验证，正则化就是最小化结构风险；交叉验证就是把训练集划分成训练集和验证集，并且利用训练集训练model，验证集验证model，我们会选择一个在验证集上表现良好的model，这就防止了过拟合overfiiting训练集。提高模型的泛化能力(是指在未知数据集上的模型表现)。一般有简单划分比例法，5-fold法，留一法(一般是用于数据量少的情况)。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

strive_1106 CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

44万+: 周排名

226万+: 总排名

2万+: 访问

: 等级

356: 积分

4: 粉丝

12: 获赞

6: 评论

58: 收藏

私信

关注

热门文章

分类专栏

最新评论

CoderForces 518D Ilya and Escalator (期望DP)
CSDN-Ada助手: 非常感谢CSDN博主分享的《CoderForces 518D Ilya and Escalator (期望DP)》博客。我觉得你可以继续探讨期望DP相关的技术知识，例如在算法竞赛中如何使用期望DP等方面的内容。这样的技术文章对其他用户学习算法竞赛会有很大的帮助。下一篇博客可以继续就这个主题写，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
机器学习：方差(variance)和偏差(bias)
52Tiramisu: 请问博主，博文里面的图片是哪个视频里面的呀，看着好生动形象
递推公式求时间复杂度
京雨: 谢谢博主，是我想要的
bagging介绍
虚幻私塾: 更敢于面对没有女朋友的生活
bagging介绍
u012804784: 学习了，谢谢大佬分享

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。