机器学习 day13（正则化，线性回归的正则化，逻辑回归的正则化）

丿罗小黑

已于 2024-03-26 20:58:31 修改

阅读量363

点赞数

分类专栏：机器学习文章标签：机器学习学习

于 2023-05-13 19:44:32 首次发布

本文链接：https://blog.csdn.net/u011453680/article/details/130661368

版权

39 篇文章 10 订阅

订阅专栏

正则化是防止模型过拟合的一种方法，通过限制特征参数的大小，保持模型简洁。它在成本函数中添加了正则项，调整λ参数来平衡误差项和正则化项。线性回归和逻辑回归的梯度下降算法都可以进行正则化，更新规则中涉及对W的缩小操作，但不对b进行正则化。

摘要由CSDN通过智能技术生成

1. 正则化的思想

如果特征的参数值更小，那么对模型有影响的特征就越少，模型就越简单，因此就不太容易过拟合
如上图所示，成本函数中有W₃和W₄，且他们的系数很大，要想让该成本函数达到最小值，就得使W₃和W₄接近0，从而消除它们对成本函数的影响，最后我们就得出一个接近二次函数（左边图片）的成本函数

2. 正则化的一般形式

通常，一个模型有很多特征，我们不知道哪个特征的参数重要，哪个特征的参数我们需要缩小或惩罚。所以，我们一般是缩小或惩罚所有特征的参数。
一般来说，我们可以给成本函数加上，Wj和b的正则项，其中b的正则项可加可不加
λ为正则参数，且λ > 0
给正则参数λ 除以 2m ，即与第一项采用相同缩放1/2m，可以当训练集发生改变时，原λ可能可以不变

3. 正则化的最终形式
正则化后的成本函数由平均误差项和正则化项组成，而最小化成本函数即最小化第一项（使预测值更好的拟合训练数据集），和最小化第二项（使特征的参数保持较小的值，防止过拟合）
λ则用来在最小化这两个项之间获得平衡，不能过大，也不能过小
当λ取0时，正则化项为0，即它并没有在最小化成本函数的过程中发挥作用，会导致函数过于复杂，模型过拟合
当λ取10¹⁰时，为了最小化成本函数，就要最小化正则化项，那么Wj必须非常接近0，即W的所有值都必须非常接近0，会导致函数平行于x轴，模型欠拟合