正则化技术分析_tcr正则化技术-CSDN博客

正则化是机器学习中的关键技术，通过引入L1和L2范数来平衡模型复杂度与泛化能力。L1正则化产生稀疏解，适合特征选择，而L2正则化防止过拟合。从贝叶斯角度，L1对应拉普拉斯分布，L2则与高斯分布相关联。图形上，L1正则化解通常位于坐标轴上，L2解接近坐标轴。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正则化是广泛应用于机器学习和深度学习中的技术，它可以改善过拟合，降低结构风险，提高模型的泛化能力，有必要深入理解正则化技术。

奥卡姆剃刀原则

奥卡姆剃刀原则称为“如无必要，勿增实体”，即简单有效原理。在机器学习中，我们说在相同泛化误差下，优先选用较简单的模型。依赖于该原则，提出了正则化技术。

什么是正则化及正则化的作用

正则化是在经验风险项后面加上正则罚项，使得通过最小化经验风险求解模型参数转变为通过最小化结构风险求解模型参数，进而选择经验风险小并且简单的模型。
在这里插入图片描述

简单的模型拟合程度差(偏差大)，泛化能力强(方差小);复杂的模型拟合程度好(偏差小)，泛化能力弱(方差大)。

正则化5

故选用合适的模型复杂度，使得泛化误差最小。

正则化的方法

正则化也可以称为规则化，在数学领域常称为范数，常用的有L1范数和L2范数。P范数的数学公式如下：

正则化6

L0范数表示向量中非零元素的个数
L1范数表示向量元素的绝对值之和

正则化7

L2范数表示向量元素的平方和再开方

正则化8

范数表示所有向量元素绝对值中的最大值

正则化9

范数表示所有向量元素绝对值中的最小值

正则化10

其中L1正则和L2正则是常用的正则化方法，L1正则可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择，同时可以防止过拟合。L2正则可以防止模型过拟合。L0范数一定可以保证得到稀疏模型，但L0范数的求解是NP难问题，实际中一般采用L1范数代替L0范数得到稀疏解，可以简单认为L1范数是L0范数的凸近似。

从图形角度分析L1正则与L2正则

从图形角度分析L1正则与L2正则，为简化分析，考虑只有两个权值向量w1和w2。

正则化11
多彩的等值线代表经验损失函数解的空间，菱形线代表L1范数空间，当二者相交时，代表了一个结构损失函数的解，L1范数与经验损失函数的交点一般在坐标轴上，从而可以使得某些w=0，进而得到稀疏解。
在这里插入图片描述
多彩的等值线代表经验损失函数解的空间，圆形线代表L2范数空间，L2范数与经验损失函数的交点一般接近于坐标轴上，可以改善过拟合，但不具有稀疏性。