偏差与方差

最新推荐文章于 2023-03-13 15:02:00 发布

DecafTea

最新推荐文章于 2023-03-13 15:02:00 发布

阅读量166

点赞数

分类专栏：机器学习基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DecafTea/article/details/111061933

版权

机器学习基础专栏收录该内容

14 篇文章 0 订阅

订阅专栏

1. 偏差与方差，泛化性能
偏差度量的是单个模型的学习能力，而方差度量的是同一个模型在不同数据集上的稳定性。

泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的难度所共同决定的。给定学习任务，为了取得好的泛化性能，则需使偏差较小，即能够充分拟合数据，并且使方差较小，即使得数据扰动产生的影响小。
在这里插入图片描述
泛化误差具体公式：

在这里插入图片描述
偏差：偏差度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力。

方差：方差度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响。在这里插入图片描述

噪声：噪声则表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。
在这里插入图片描述

2. 欠拟合（偏差大）与过拟合（方差大）
欠拟合阶段——偏差主导泛化误差：在训练不足时，学习器的拟合能力不够强，训练数据的扰动不足以使学习器产生显著变化，此时偏差主导了泛化错误率。

过拟合阶段——方差主导泛化误差：随着训练程度的加深，学习器的拟合能力逐渐增强，训练数据发生的扰动渐渐能被学习器学到，方差逐渐主导了泛化错误率；在训练程度充足后，学习器的拟合能力已经非常强，训练数据发生的轻微扰动都会导致学习器发生显著变化，若训练数据自身的、非全局的特性被学习器学到了，则将发生过拟合。

3. boosting（降低偏差）与bagging（降低方差）

Bagging算法是对训练样本进行采样，产生出若干不同的子集，再从每个数据子集中训练出一个分类器，取这些分类器的平均，所以是降低模型的方差（variance）。Bagging算法和Random Forest这种并行算法都有这个效果。Boosting则是迭代算法，每一次迭代都根据上一次迭代的预测结果对样本进行权重调整，所以随着迭代不断进行，误差会越来越小，所以模型的偏差（bias）会不断降低。

reference:

[1] 偏差和方差有什么区别？ - 「已注销」的回答 - 知乎
https://www.zhihu.com/question/20448464/answer/765401873

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
偏差与方差

1. 偏差与方差，泛化性能偏差度量的是单个模型的学习能力，而方差度量的是同一个模型在不同数据集上的稳定性。泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的难度所共同决定的。给定学习任务，为了取得好的泛化性能，则需使偏差较小，即能够充分拟合数据，并且使方差较小，即使得数据扰动产生的影响小。泛化误差具体公式：偏差：偏差度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力。方差：方差度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。