【机器学习基础】误差分析

最新推荐文章于 2024-08-04 08:00:00 发布

GentleCP

最新推荐文章于 2024-08-04 08:00:00 发布

阅读量3.8k

点赞数 1

分类专栏：机器学习(深度学习) 文章标签：机器学习误差分析泛化误差过拟合欠拟合

本文链接：https://blog.csdn.net/GentleCP/article/details/104951049

版权

本文探讨了机器学习中的误差分析，包括训练误差与泛化误差的概念。重点讲述了过拟合和欠拟合的现象，分析了它们的原因，并提出了相应的处理办法，如增加训练样本、减少特征维数和使用正则化项。通过对泛化误差的深入理解，有助于优化模型性能。

摘要由CSDN通过智能技术生成

本文属于我的机器学习/深度学习系列文章，点此查看系列文章目录

前言

误差是用于衡量模型预测与真实结果的度量，其给出了预测输出与样本真实输出之间的差异。因此，误差分析也是机器学习中不可避免的一环。本文将详细讲述误差分析的过程以及模型过拟合、欠拟合等的原理。

文章参考了UCAS张新峰老师的课件，也是我自己的学习笔记

误差分类

按照误差产生的数据样本不同，可以将误差分为：

训练误差：模型在训练集上的误差
泛化误差：模型在新样本上的误差

训练误差很容易进行分析，因为是在有限的训练样本上进行误差分析，只需要确定好误差(损失)函数，就可以计算得到预测输出和真实结果的差距。但泛化误差由于我们无法获得所有的测试样本，只能通过有限的测试集去计算误差，因此泛化误差分析要更为复杂。模型过拟合与欠拟合就是泛化误差分析得到的结果。

泛化误差分析

不妨设有训练集 $D_{train} = \{\mathbf (x_1,y_1),(\mathbf x_2,y_2),...,(\mathbf x_n,y_n)\}$ ，且数据 $\mathbf x$ 与标签 $y$ 之间存在真实模型关系如下：
$y_i = f_{train}(\mathbf x_i) = f_{true}(\mathbf x_i) + \varepsilon_i \tag{1}$
其中 $\varepsilon_i$ 表示噪声（训练模型和真实模型之间存在误差），均值为0,方差为 $\sigma^2$ 。

在训练集上，我们通过定义误差函数来求解优化得到训练模型 $f_{train}(\mathbf x)$ ，误差函数如下：
$\min_{\mathbf w}trainErr(\mathbf w,D_{train}) = \frac{1}{n}\sum_{i=1}^n(f_{train}(\mathbf x_i)-y_i)^2 \tag{2}$