机器学习偏差、方差、泛化误差的完整总结

最新推荐文章于 2025-03-15 15:13:33 发布

data大柳

最新推荐文章于 2025-03-15 15:13:33 发布

阅读量4.5k

点赞数 9

分类专栏：机器学习文章标签：偏差方差泛化误差训练误差测试误差

本文链接：https://blog.csdn.net/yawei_liu1688/article/details/113783803

版权

本文详细介绍了机器学习中的偏差、方差和泛化误差概念，探讨了训练误差与测试误差的区别，并分析了偏差与方差的权衡。通过分解泛化误差，展示了它是由偏差、方差和噪声组成。文章还讨论了解决偏差和方差问题的方法，如选择合适模型、增大数据集、正则化等，并提到了交叉验证在评估模型泛化能力中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

综述

机器学习算法的最终目标是最小化期望损失风险（即机器学习模型在任意未知测试样本上的表现），但由于数据的真实分布我们通常是不知道的，我们可用的信息来自于训练数据，因此，机器学习的学习目标往往会转化为最小化经验风险。优化算法对经验风险最小化问题进行求解，并在算法结束的第 $T$ 次迭代中输出模型。我们希望所学习到的该模型对未知数据预测的误差尽可能小，这里的误差我们就将其定义为机器学习算法的泛化误差（generalization error）： $\begin{aligned} R_{\exp }(\hat{f}) &=E_{P}[L(Y, \hat{f}(X))] \\ &=\int_{\mathcal{X} \times \mathcal{Y}} L(y, \hat{f}(x)) P(x, y) \mathrm{d} x \mathrm{~d} y \end{aligned}$

泛化误差反映了学习方法的泛化能力，因为我们学习一个模型通常是为了解决训练数据集这一领域中的一般化问题，因此仅仅将训练数据集的经验风险最小化得到的模型推广应用到更为一般的问题时，并不能保证模型仍然是最优的，甚至模型是否可用都不能保证。所以如果一种方法学习的模型比另一种方法学习的模型具有更小的泛化误差，那么这种方法就更有效。事实上，泛化误差就是学习得到的模型的期望风险。

泛化误差可以分解为偏差(Bias)、方差(Variance)和噪声(Noise)。我们下边将做详细介绍，但在学习偏差、方差之前，我们先来了解两个概念：训练误差与测试误差。

训练误差与测试误差

我们都知道，最好的机器学习模型不仅要对已知数据有很好的预测能力，也要求对新数据，也就是未知数据也要有很好的预测能力。

当选定了损失函数，基于损失函数而计算的模型的训练误差（training error）和测试误差（test error）就成为学习方法评估的标准。

训练误差：是机器学习模型关于训练数据集的平均损失
测试误差：是机器学习模型关于测试数据集的平均损失

假设现在有一个学习到的模型： $Y=\hat{f}(X)$ ，另外假设 $N$ 是训练数据集的样本规模，那么训练误差为： $R_{\mathrm{emp}}(\hat{f})=\frac{ {1}}{N} \sum_{i=1}^{N} L\left(y_{i}, \hat{f}\left(x_{i}\right)\right)$