我要学统计|什么是Regulaization（正则化）？

sunwx98

已于 2024-07-23 09:13:13 修改

阅读量565

点赞数 10

文章标签：人工智能机器学习

于 2024-06-03 15:05:20 首次发布

本文链接：https://blog.csdn.net/sunwx98/article/details/139414829

版权

正则化（Regularization）是机器学习和统计建模中用于防止过拟合（overfitting）的一种技术。过拟合发生在模型对训练数据的小波动或噪声过于敏感，从而失去了泛化到新数据的能力。正则化通过在模型的损失函数中添加一个额外的项来实现，这个额外的项会惩罚模型的复杂度。

损失函数（Loss Function）：损失函数衡量模型预测值与实际观测值之间的差异。在正则化中，原始的损失函数会加上一个正则化项。
正则化项（Regularization Term）：正则化项通常是模型参数的一个函数，它鼓励模型参数保持较小的值。正则化项的目的是简化模型，使其不过于复杂。
正则化系数（Regularization Parameter）：正则化系数是一个超参数，用于控制正则化项的强度。增加正则化系数的值会增强正则化的效果，使模型更简单。
L1正则化（L1 Regularization）：也称为Lasso正则化，它在损失函数中添加了参数的绝对值之和。L1正则化有助于产生稀疏的模型参数，即许多参数值为零。
L2正则化（L2 Regularization）：也称为Ridge正则化，它在损失函数中添加了参数平方和的项。L2正则化倾向于让参数值接近零但不完全为零，从而保持模型的平滑性。
弹性网（Elastic Net）正则化：结合了L1和L2正则化，同时惩罚参数的绝对值和平方。这种方法结合了L1正则化产生稀疏解和L2正则化稳定性的优点。

收缩通常指的是在估计参数时，向零方向的收缩或缩减。在统计学中，收缩是一种减少参数估计波动性的方法，它可以使估计值更接近于零或某个先验值。收缩技术包括：

Lasso Regression： L1 regularization

Ridge Regression：L2 regularization

降维：(Dimension Reduction Methods)

主成分回归（Principal Component Regression, PCR

sunwx98

关注