正则化（Regularization）

蜡笔小潘和野原小白

于 2020-07-20 16:45:36 发布

阅读量322

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45242264/article/details/107465504

版权

机器学习专栏收录该内容

18 篇文章 1 订阅

订阅专栏

正则化（Regularization）

一、过度拟合问题
二、代价函数
- 2.1 假设提出
- 2.2 λ的选择
三、正则化线性回归
四、正则化逻辑回归
- 4.1 正则化逻辑回归代价函数
- 4.2 梯度下降算法

一、过度拟合问题

现象描述：假设有很多特征，通过学习得到的假设可以很好的适应训练集（代价函数几乎为0），但是可能会不能推广到新的数据。
在这里插入图片描述

1.1 回归问题

①第一个模型：线性模型，欠拟合，不能很好的适应训练集。
②第三个模型：过拟合，过于强调拟合原始数据，丢失算法本质。虽然能非常好的适应训练集，但在新输入变量进行预测时可能效果不佳。

1.2 分类问题

在这里插入图片描述

1.3 处理

①丢弃某些特征，可以通过手工选择或使用模型选择的算法。
②正则化，保留所有特征，减少参数的大小。

二、代价函数

2.1 假设提出

以上述回归模型为例，式中高次项导致了过拟合的产生。
正则化基本方法：使高次项系数接近于0，即在一定程度上减小参数θ的值。
在这里插入图片描述
要减少θ3和θ4的大小，要修改代价函数，在θ3和θ4设置一点惩罚，在尝试最小化代价时也要将惩罚纳入考虑，最终选择较小一些的θ3和θ4。修改后的代价函数如下：

假如有非常多的特征且不知道哪些特征要惩罚，则对所有特征进行惩罚，让代价函数最优化的软件选择惩罚的程度，得到一个较为简单的能防止过拟合问题的假设：
在这里插入图片描述
其中λ称为正则化参数（Regularization Parameter）。
注：一般不对θ0进行惩罚
经过正则化处理的模型与原模型的可能对比如下图所示：

2.2 λ的选择

若选择的正则化参数λ很大，所有参数都会在一定程度上减小，当λ过大时，θ都会趋近于0，导致模型变成h_θ（x）=θ0，即上述红线所示情况，造成欠拟合。

三、正则化线性回归

3.1 正则化线性回归代价函数

在这里插入图片描述

3.2 梯度下降算法

在这里插入图片描述
其中 h_θ^(x) = θ^TX
当 j ≠ 0时，式子可更新为

变化：每次都在原有算法更新规则的基础上令θ值减少一个额外的值

3.3 正规方程求解正则化线性回归模型

原始
在这里插入图片描述
修改后

图中矩阵尺寸为（n+1）*（n+1）

四、正则化逻辑回归

4.1 正则化逻辑回归代价函数

在这里插入图片描述

4.2 梯度下降算法

在这里插入图片描述
其中h_θ^(x) = g（θ^TX）

蜡笔小潘和野原小白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则化（Regularization）

正则化（Regularization）一、过度拟合问题1.1 回归问题1.2 分类问题1.3 处理二、代价函数2.1 假设提出2.2 λ的选择三、正则化线性回归3.1 正则化线性回归代价函数3.2 梯度下降算法3.3 正规方程求解正则化线性回归模型四、正则化逻辑回归4.1 正则化逻辑回归代价函数4.2 梯度下降算法一、过度拟合问题现象描述：假设有很多特征，通过学习得到的假设可以很好的适应训练集（代价函数几乎为0），但是可能会不能推广到新的数据。1.1 回归问题①第一个模型：线性模型，欠拟合，不能很
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。