偏差与方差

最新推荐文章于 2021-11-14 23:43:32 发布

Lavender-csdn

最新推荐文章于 2021-11-14 23:43:32 发布

阅读量331

点赞数 1

分类专栏：机器学习文章标签：数据挖掘机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kidchildcsdn/article/details/104970140

版权

机器学习专栏收录该内容

31 篇文章

订阅专栏

偏差-方差分解是评估学习算法泛化能力的关键，它将期望泛化误差分为偏差、方差和噪声三部分。偏差衡量预测与真实结果的偏离，方差反映了训练集变化对学习性能的影响，而噪声则表示任务本身的难度。偏差和方差之间存在矛盾，即偏差-方差窘境。训练不足时偏差主导，训练过度时方差主导，找到合适的平衡至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

“偏差-方差分解”是解释学习算法泛化性能的一种重要工具。偏差-方差分解试图对学习算法的期望泛化错误率进行拆解。算法在不同训练集上学到的结果很可能不同，即便这些训练集来自同一个分布。对于测试样本 $\textbf{x}$ ，令 $y_D$ 为 $\textbf{x}$ 在数据集中的标记， $y$ 为 $\textbf{x}$ 的真实标记， $f(\textbf{x};D)$ 为训练集D上学的模型 $f$ 在 $\textbf{x}$ 上的预测输出。

以回归任务为例子，学习算法的期望预测为：

使用样本数相同的不同训练集产生的方差为：

噪声为

其中期望输出与真实标记的差别为偏差(bias)：

为了便于计算，假定噪声期望为0：

对算法的期望泛化误差进行分解：

所以：

如此看来，泛化误差可以分解为偏差、方差与噪声之和。

偏差度量了学习算法的期望预测与真实结果的偏离程度，刻画了学习算法本身的拟合能力。

方差度量了同样大小的训练集的变动所导致的学习性能的变化，刻画了数据扰动对学习算法的结果造成的影响

噪声表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界，刻画了学习问题本身的难度。

偏差-方差分解说明，泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的难度所共同决定的。

一般来说，偏差和方差是有冲突的，这称为偏差-方差窘境。

给定学习任务，假定我们能够控制学习算法的训练程度，则在训练不足的时候，学习器的拟合能力不够强，训练数据的扰动不足以使学习器产生显著变化，此时偏差主导了泛化错误率；随着训练程度的加深，学习器的拟合能力逐渐增强，训练数据发成的扰动渐渐被学习器学到，方差逐渐主导了泛化错误率；在训练程度充足后，学习器的拟合能力已经非常强，训练数据发成的轻微扰动都会法制学习器发生显著变化，若训练数据自身的、非全局的特征被学习器学到了，则会发生过拟合。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。