【正则化解决过拟合问题】

最新推荐文章于 2024-03-06 17:58:28 发布

武帝为此

最新推荐文章于 2024-03-06 17:58:28 发布

阅读量519

点赞数 7

分类专栏：数学建模文章标签：机器学习深度学习 python

本文链接：https://blog.csdn.net/qq_66726657/article/details/135712116

版权

数学建模专栏收录该内容

103 篇文章 13 订阅

订阅专栏

本文详细介绍了正则化在防止过拟合中的作用，区分了L1和L2正则化的机制，以及它们如何通过控制模型复杂度、提高稳定性、进行特征选择和改善多重共线性。同时，给出了使用PythonScikit-learn进行Ridge正则化线性回归的实际示例。

摘要由CSDN通过智能技术生成

文章目录

前言

当模型在训练数据上表现得非常好，但在新数据上表现不佳时，就会出现过拟合的情况。

什么是正则化？

正则化是一种用于控制模型复杂度的技术，它通过在损失函数中添加额外的惩罚项来限制模型的参数值。这样做的目的是防止模型在训练过程中过度拟合训练数据，从而提高模型的泛化能力。在正则化中，通常会使用两种惩罚项：L1 正则化和 L2 正则化。

L1 正则化

L1 正则化也被称为 Lasso 正则化。它通过在损失函数中添加参数权重的绝对值之和来实现。具体来说，对于线性回归模型，L1 正则化的损失函数如下：

L1 Loss = MSE + λ * Σ|θi|

其中，MSE 表示均方误差，θi 表示模型的参数，λ 是正则化参数，用来控制正则化的强度。

L2 正则化

L2 正则化也被称为 Ridge 正则化。它通过在损失函数中添加参数权重的平方和来实现。对于线性回归模型，L2 正则化的损失函数如下：

L2 Loss = MSE + λ * Σθi^2

与 L1 正则化类似，λ 是正则化参数，用来控制正则化的强度。

为什么需要正则化？

正则化的主要目的是减小模型的复杂度，防止过拟合。当模型过于复杂时，它可能会在训练数据上表现得非常好，但无法泛化到新数据。正则化通过限制模型参数的大小，迫使模型变得更简单，更容易泛化到新数据。

另外，正则化还有以下几个优点：

提高模型的稳定性：正则化可以减少模型参数的不稳定性，使模型更加稳定。
特征选择：L1 正则化可以促使模型对某些特征的权重变为零，从而实现特征选择的效果。
改善多重共线性：L2 正则化有助于解决多重共线性问题，使模型更可靠。

如何使用正则化？

from sklearn.linear_model import Ridge
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 加载数据集
data = load_diabetes()
X = data.data
y = data.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建 Ridge 模型并设置正则化参数
ridge = Ridge(alpha=1.0)

# 训练模型
ridge.fit(X_train, y_train)

# 预测
y_pred = ridge.predict(X_test)

# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")