【AI知识点】正则化（Regularization）

AI完全体

已于 2024-10-16 00:07:57 修改

阅读量1.4k

点赞数 20

分类专栏： AI知识点文章标签：人工智能机器学习深度学习过拟合权重衰减 dropout 神经网络

于 2024-10-06 12:11:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43221845/article/details/142720569

版权

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】

正则化（Regularization） 是机器学习和统计学中的一种技术，用于防止模型过拟合。在训练模型时，模型可能会过度拟合训练数据，导致在新数据上的表现较差。正则化通过在优化过程中引入额外的约束或惩罚项，使模型更简单、泛化能力更强，从而避免过拟合。

1. 过拟合问题的背景

过拟合（Overfitting） 发生在模型在训练数据上表现得非常好，但在测试数据上表现不佳时。原因是模型学到了数据中的噪声或随机波动，而不是数据的基本模式。这通常发生在模型过于复杂时，比如当模型的参数过多，或者模型训练的迭代次数过多。

过拟合的表现通常是：

训练集误差很小，模型在训练集上表现很好。
测试集误差较大，模型在新数据上表现较差。

为了解决这个问题，我们可以通过正则化来限制模型的复杂度，使其更好地泛化到新数据上。

2. 正则化的基本原理

正则化通过在损失函数中引入一个额外的惩罚项，来限制模型的复杂度，防止模型过度拟合训练数据。正则化会迫使模型的参数变小（接近于零），从而使得模型更加平滑，避免复杂的参数设置。

目标函数的通用形式为：

$\text{目标函数} = \text{原始损失函数} + \lambda \cdot \text{正则化项}$

其中：

原始损失函数：例如，线性回归中的均方误差 (MSE)。
正则化项：通常是模型参数的某种形式的范数（如 L1 或 L2 范数）。
$\lambda$ ：正则化强度的超参数，控制正则化项的影响大小。当 $\lambda = 0$ 时，没有正则化；当 $\lambda$ 较大时，正则化项的影响变强。

3. 常见的正则化方法

a. L2 正则化（Ridge 回归，岭回归）

L2 正则化 是一种常见的正则化技术，它在损失函数中加入参数的平方和作为惩罚项。具体来说，L2 正则化会通过惩罚模型参数的平方和来限制模型的参数值。

对于线性回归问题，L2 正则化的目标函数为：

$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} \left( h_\theta(x^{(i)}) - y^{(i)} \right)^2 + \lambda \sum_{j=1}^{n} \theta_j^2$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。