机器学习范数与过拟合

slomay

已于 2023-12-08 23:52:12 修改

阅读量65

点赞数

文章标签：机器学习人工智能经验分享

于 2023-12-08 18:43:03 首次发布

本文链接：https://blog.csdn.net/weixin_45891757/article/details/134885131

版权

“范数”（Norm）是一个用于衡量向量大小的数学概念。在线性代数中，范数是对向量空间中的向量进行度量的一种方式，通常表示为 ||x||。不同的范数定义了不同的向量度量方法。

$lp$ -范数的定义

表示向量 x中非0元素的个数。

3. 当 p=2，为L2 范数（欧几里德范数）：

4. 为方便统一，一般将任意向量 x 的 $lp$ -范数定义为：

这些范数在不同的应用中有不同的用途。在机器学习和优化问题中，范数经常用于正则化项，帮助控制模型的复杂性或防止过拟合。不同的范数在正则化中起到不同的效果，例如 L1 正则化倾向于产生稀疏解，而 L2 正则化倾向于产生较小的权重。

机器学习中的一个核心问题是设计不仅在训练数据上表现好，并且能在新输入上泛化好的算法。在机器学习中，许多策略显式地被设计来减少测试误差（可能会以增大训练误差为代价），也就是防止过拟合的策略。这些策略被统称为正则化。

加入正则项之后我们要做的事情就是在满足惩罚项约束的情况下，使得损失项的值最小

原因上述也有说到，这里我们形象地进行解释。首先我们先解释一下什么是过拟合：假设我们正在训练一个机器学习模型，我们想让它学会一个二分类问题，将类似下述的字分成两类：

把拔挤拉拟 | 们俩仨付仕

在我的期待里，我希望这个模型可以根据字的偏旁进行分类，比如提手旁的分为第一类，单人旁的分为第二类。

那么当我输入扪的时候，我希望它可以被分为第一类。但是现实的情况很可能是这样，由于模型的学习能力太强了，把每个字的每一笔都学习很好，所以当我给出扪的时候，我们可爱的模型可能觉得它更像们，于是就把它分到第二类去啦。

上述的情况就是模型过拟合啦！！那么正则化的作用就是在损失函数中加入一个正则化项，让模型变得笨一点，在训练的过程中，不要标记那么多的特征，只需要把重要的特征标记就好了。如下所示，我们希望模型记住提手旁就好了

为了实现上述目标，我们首先要使得与提手旁相关的权重值不为0，其他不相关的神经元的权重最好为0好使得神经元的值为0。

这里还要进一步解释仅仅靠损失函数是做不到的，因为这样会使得模型学习得很好，每个特征都不会为0.

使得上述无关特征为0，相关特征不为0的解。在机器学习中，是一个稀疏的向量解，如下所示：