机器学习--正则化(Regularization)

最新推荐文章于 2024-02-22 17:02:09 发布

SUNNY小飞

最新推荐文章于 2024-02-22 17:02:09 发布

阅读量596

点赞数

分类专栏：机器学习文章标签：机器学习正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34290470/article/details/101852942

版权

机器学习专栏收录该内容

23 篇文章 3 订阅

订阅专栏

机器学习--正则化(Regularization)

【基本概念】

正则化是指修改学习算法，使其降低泛化误差.

正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。

我们在构造机器学习模型时，最终目的是让模型在面对新数据的时候，可以有很好的表现。当你用比较复杂的模型比如神经网络，去拟合数据时，很容易出现过拟合现象(训练集表现很好，测试集表现较差)，这会导致模型的泛化能力下降，这时候，我们就需要使用正则化，降低模型的复杂度。

【实际意义】

在训练过程中：

在训练集中有时效果比较差，我们叫做欠拟合；
有时候效果过于完美，在测试集上效果很差，我们叫做过拟合。

因为欠拟合和过拟合都不能良好的反应一个模型应用新样本的能力，因此需要找到办法解决这个问题。

想要解决这个问题，有两个办法：

减少特征的数量，可以通过一些特征选择的方法进行筛选。
正则化，通过引入一个正则项，限制参数的大小。

比如下面的曲线，针对高次项的参数，在后面多加一项乘以1000。这样在优化损失函数的时候，会强制θ3和θ4不会很大，并且趋近于0，只有这样才会保证损失函数的值足够小。

得到的公式如下，注意只会针对x1开始，θ0相当于只是针对偏置项设置的，因此不需要加正则项。

但是如果λ设置的过大，相当于所有的θ都变成了0，损失函数的曲线相当于一条直线，就没有任何意义了，因此选择适合的λ很重要，后面也会讲解如何选择正确的λ。

添加正则项之后，梯度下降的公式就发生了变化：

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习--正则化(Regularization)

机器学习--正则化(Regularization)【基本概念】正则化是指修改学习算法，使其降低泛化误差.正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。我们在构造机器学习模型时，最终目的是让模型在面对新数据的时候，可以有很好的表现。当你用比较复杂的模型比如神经网络，去拟合数据时，很容易出现过拟合现象(训练集表现很好，测试集表现较差)，这会导致模型的泛化能力下降，这...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SUNNY小飞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。