机器学习 —误差理论

最新推荐文章于 2024-07-26 19:17:27 发布

Johnny_Cuii

最新推荐文章于 2024-07-26 19:17:27 发布

阅读量3.3k

点赞数 2

分类专栏：数学推导机器学习文章标签：机器学习算法调试

本文链接：https://blog.csdn.net/cuihuijun1hao/article/details/72635871

版权

误差理论在机器学习中至关重要，它探讨了偏差和方差的概念。偏差表示模型的预测能力，当模型过于简单时偏差较大；而方差则衡量模型对数据噪声的敏感性，复杂模型通常方差较高。通过理论学习，如Chernoff边界和Hoeffding不等式，可以理解和平衡偏差与方差，从而选择合适的模型并进行有效的算法调试。经验风险最小化（ERM）是常用的策略，它在训练数据上寻找最小误差的模型。此外，VC维的概念帮助我们理解模型复杂度与泛化能力之间的关系。

摘要由CSDN通过智能技术生成

学习误差理论，会让我一肚子疑惑，学完了之后不知道怎么用。按照目前的理解是，这就是理论，知道有这样的性质，就像我们学高数的时候，一个个公式，我们知道有这么回事就OK了。这部分内容对以后算法调试会奠定理论基础，多读书总是好的！开始正式内容
最主要的两个概念偏差和方差
方差都知道，现在来说说什么是偏差
这里写图片描述

这个图是我们针对样本进行的拟合的效果，其中图1，我们是用线性拟合，图中我们能看到拟合效果很弱，这个时候带来的问题就是偏差比较大
图三中我们看到，在样本上拟合效果非常好，偏差很小。
但是图一和图三他们的泛化能力都不好，用专业的术语就是泛化误差比较大。

这样一种规律：如果模型过于简单，其具有大的偏倚，而如果模型过于复杂，它就有大的方差。调整模型的复杂度，建立适当的误差模型，就变得极其重要了。

关于偏差和方差我们了解了之后，我们要运用它需要两个重要的引理。
我们在学习的时候，要带着以下三个问题去学习
一. 我们如何通过理论来解决偏差和方差的均衡? 这个会帮助选择模型
二.我们真正关心的是泛化误差,但是我们都是在训练模型上得到是训练误差,我们怎么把训练误差和泛化误差联系起来?
三.有什么理论可以支撑,我们在一定条件下可以证明某个模型是良好工作的?

这里写图片描述