正则化（Regularization）

小胡不加班

已于 2024-08-07 11:36:31 修改

阅读量298

点赞数 3

分类专栏：数学建模文章标签： python 算法数据挖掘机器学习深度学习 sklearn

于 2024-08-02 10:39:10 首次发布

本文链接：https://blog.csdn.net/m0_74235619/article/details/140866152

版权

3 篇文章 2 订阅

订阅专栏

正则化（Regularization）是一种在机器学习和统计建模中常用的技术，用于防止模型过拟合（overfitting）。过拟合是指模型在训练数据上表现得很好，但对新的、未见过的数据泛化能力差。正则化通过在模型的损失函数中添加一个额外的项来实现，这个额外的项通常与模型的复杂度相关。

正则化的主要目的是：

常见的正则化技术包括：

$\text{Regularization Term} = \lambda \sum_{i=1}^n |w_i|$ .

L2 正则化（Ridge 正则化）：在损失函数中添加参数的平方和，这会使得参数值尽可能小，但不会稀疏化。
$\text{Regularization Term} = \lambda \sum_{i=1}^n w_i^2$
弹性网（Elastic Net）正则化：结合了L1和L2正则化，同时惩罚参数的绝对值和平方值。
$\text{Regularization Term} = \lambda_1 \sum_{i=1}^n |w_i| + \lambda_2 \sum_{i=1}^n w_i^2$

其中， $\lambda$ （或 $\lambda_1$ 和 $\lambda_2$ ）是正则化系数，控制正则化项的强度。这些系数是超参数，通常通过交叉验证等方法来选择。

正则化在各种机器学习算法中都有应用，包括线性回归、逻辑回归、支持向量机等。通过正则化，可以平衡模型的偏差（bias）和方差（variance），从而提高模型在新数据上的预测性能。

关注

专栏目录