【学习笔记】机器学习(Machine Learning) | 第六章(3)| 过拟合问题-CSDN博客

本文链接：https://blog.csdn.net/2401_87688549/article/details/147781557

机器学习（Machine Learning）

简要声明

基于吴恩达教授(Andrew Ng)课程视频
BiliBili课程资源

文章目录

机器学习（Machine Learning）
- 简要声明
正则化的应用

正则化的应用

一、带正则化的代价函数

在带正则化的代价函数中，我们在原始代价函数的基础上添加了一个正则化项。对于线性回归模型，其带正则化的代价函数形式如下：

$J(\mathbf{w}, b) = \frac{1}{2m} \sum_{i=1}^{m} \left( f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)} \right)^2 + \frac{\lambda}{2m} \sum_{j=1}^{n} w_j^2$

其中：

$m$ 是训练样本的数量
$n$ 是特征的数量
$\lambda$ 是正则化参数，用于控制正则化的强度

正则化项 $\frac{\lambda}{2m} \sum_{j=1}^{n} w_j^2$ 会惩罚过大的参数值，使模型更倾向于学习较小的参数，从而降低模型的复杂度。

二、正则化线性回归

在正则化线性回归中，我们通过梯度下降算法来最小化带正则化的代价函数。其梯度下降的更新规则如下：

$w_j = w_j - \alpha \left[ \frac{1}{m} \sum_{i=1}^{m} \left( f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)} \right) x_j^{(i)} + \frac{\lambda}{m} w_j \right]$

$\alpha \frac{1}{m} \sum_{i=1}^{m} \left( f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)} \right)$

其中：

$\alpha$ 是学习率
$w_j$ 是特征 ( j ) 的参数
$b$ 是偏置项

在梯度下降过程中，正则化项会使得参数 $w_j$ 在每次更新时都乘以一个因子 $\alpha \frac{\lambda}{m})$ ，从而实现参数的“收缩”。

正则化线性回归与普通线性回归对比	正则化线性回归	普通线性回归
更新规则	包含正则化项	不包含正则化项
参数变化	参数逐渐收缩	参数无收缩
泛化能力	更强	较弱

三、正则化逻辑回归

正则化逻辑回归与正则化线性回归类似，其代价函数也包含一个正则化项。对于逻辑回归模型，其带正则化的代价函数形式如下：

$J(\mathbf{w}, b) = -\frac{1}{m} \sum_{i=1}^{m} \left[ y^{(i)} \log(f_{\mathbf{w},b}(\mathbf{x}^{(i)})) + (1 - y^{(i)}) \log(1 - f_{\mathbf{w},b}(\mathbf{x}^{(i)})) \right] + \frac{\lambda}{2m} \sum_{j=1}^{n} w_j^2$