regularization 正则化

最新推荐文章于 2024-07-31 14:30:10 发布

影灵衣

最新推荐文章于 2024-07-31 14:30:10 发布

阅读量389

点赞数

分类专栏： machine learn 文章标签：正则化 python

本文链接：https://blog.csdn.net/ZAQ1018472917/article/details/85041914

版权

machine learn 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

机器学习笔记 - 吴恩达 - 目录

笔记

描述

正则化是什么？
正则化是通过对假设函数附加一项正则化参数，来减小该项的拟合程度。

为什么要有正则化？
有的时候，为了更好的拟合数据的情况，我们会在训练时，添加高阶项。但这会引发新的问题，如果训练的足够多，那会产生过拟合现象，这时候很难对测试数据有更好的泛化性。如果训练的不够，又会导致欠拟合情况，连训练集都无法准确预测。

线性回归_欠拟合_过拟合

逻辑回归_欠拟合_过拟合

如何正则化？
为了不过拟合，我们想要保持高阶项的系数足够小（又不想直接去除该项，因为高阶项或多或少有一定影响），引入一个惩罚项，称为正则化项，使得模型相对简单。
引入正则化项惩罚特征

为何正则化能减小某一项的影响？
我们通过设置正则化参数 $\lambda$ ，该值设得越大，就对其特征 $\theta_j$ 惩罚程度越大，使其特征 $\theta_j$ 的影响越小。
（这是由于，训练时有正则化项，预测时没有，所以 $\theta_j$ 的值小了，影响小了）
注：惩罚过大，可能出现欠拟合

关键点

（我们不对j=0对应的 $\theta_0$ 作惩罚，因为 $\theta_0$ 项的 $x_0 = 1$ ，没有必要惩罚）

线性回归的正则化：
代价函数：
$J(\theta) = \frac{1}{2m} [ \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{i})^2 + \lambda \sum_{j=1}^{n} \theta_j^2]$
更新系数：
$\theta_0 := \theta_0 - \alpha \frac{1}{m} \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{(i)}) x_j^{(i)} \ \ \ \ \ (j = 0) \\ \theta_j := \theta_j - \alpha [ \frac{1}{m} \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{(i)}) x_j^{(i)} + \frac{\lambda}{m} \theta_j ] \\ := \theta_j (1 - \lambda \frac{\lambda}{m}) - \alpha \frac{1}{m} \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{(i)}) x_j^{(i)} \ \ \ \ \ (j = 1, 2, ... , n)$
（其中， $\lambda \sum_{j=1}^{n} \theta_j^2$ 就是正则化参数regularization parameter）

逻辑回归的正则化：
代价函数：
$(\theta) = - [\frac{1}{m} \sum_{i=1}^{m} y^i log{h_\theta (x^{(i)})} + (1 - y^{i}) log ({1 - h_\theta (x^{i}))}] + \frac{\lambda}{2m} \sum_{j=1}^{n} \theta_j^2$
更新系数：
$\theta_0 := \theta_0 - \alpha \frac{1}{m} \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{(i)}) x_j^{(i)} \ \ \ \ \ (j = 0) \\ \theta_j := \theta_j - \alpha [\frac{1}{m} \sum_{i=1}^{m} (h_\theta (x^{(i)}) - y^{(i)}) x_j^{(i)} + \frac{\lambda}{m} \theta_j ] \ \ \ \ \ (j = 1, 2, 3, ... , n)$
（其中， $\frac{1}{2m} \lambda \sum_{j=1}^{n} \theta_j^2$ 就是正则化参数regularization parameter）

影灵衣

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
regularization 正则化

机器学习笔记 - 吴恩达 - 目录笔记描述正则化是什么？正则化是通过对假设函数附加一项正则化参数，来减小该项的拟合程度。为什么要有正则化？有的时候，为了更好的拟合数据的情况，我们会在训练时，添加高阶项。但这会引发新的问题，如果训练的足够多，那会产生过拟合现象，这时候很难对测试数据有更好的泛化性。如果训练的不够，又会导致欠拟合情况，连训练集都无法准确预测。如何正则化？为了不过拟合...
复制链接

扫一扫

专栏目录