L1，L2正则化

最新推荐文章于 2023-05-27 22:41:35 发布

yeler082

最新推荐文章于 2023-05-27 22:41:35 发布

阅读量1.1k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeler082/article/details/89702989

版权

机器学习专栏收录该内容

24 篇文章 4 订阅

订阅专栏

一、概括：

L1和L2是正则化项，又叫做罚项，是为了限制模型的参数，防止模型过拟合而加在损失函数后面的一项。

机器学习中，如果参数过多，模型过于复杂，容易造成过拟合（overfit）。即模型在训练样本数据上表现的很好，但在实际测试样本上表现的较差，不具备良好的泛化能力。为了避免过拟合，最常用的一种方法是使用使用正则化，例如 L1 和 L2 正则化。我们知道，正则化的目的是限制参数过多或者过大，避免模型更加复杂。例如，使用多项式模型，如果使用 10 阶多项式，模型可能过于复杂，容易发生过拟合。所以，为了防止过拟合，我们可以将其高阶部分的权重 w 限制为 0，这样，就相当于从高阶的形式转换为低阶。下面对二者做一个对比：

二、区别：

1.L1是模型各个参数的绝对值之和。

　L2是模型各个参数的平方和的开方值。

2.L1会趋向于产生少量的特征，而其他的特征都是0.

　因为最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0 ，产生稀疏权重矩阵。

　L2会选择更多的特征，这些特征都会接近于0。

最优的参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0。当最小化||w||时，就会使每一项趋近于0。

三、再讨论几个问题

1.为什么参数越小代表模型越简单？

　　越是复杂的模型，越是尝试对所有样本进行拟合，包括异常点。这就会造成在较小的区间中产生较大的波动，这个较大的波动也会反映在这个区间的导数比较大。

　　只有越大的参数才可能产生较大的导数。因此参数越小，模型就越简单。

2.实现参数的稀疏有什么好处？

　　因为参数的稀疏，在一定程度上实现了特征的选择。一般而言，大部分特征对模型是没有贡献的。这些没有用的特征虽然可以减少训练集上的误差，但是对测试集的样本，反而会产生干扰。稀疏参数的引入，可以将那些无用的特征的权重置为0.

3.L1范数和L2范数为什么可以避免过拟合？

　　加入正则化项就是在原来目标函数的基础上加入了约束。当目标函数的等高线和L1,L2范数函数第一次相交时，得到最优解。

L1范数：

　L1范数符合拉普拉斯分布，是不完全可微的。表现在图像上会有很多角出现。这些角和目标函数的接触机会远大于其他部分。就会造成最优值出现在坐标轴上，因此就会导致某一维的权重为0 ，产生稀疏权重矩阵，进而防止过拟合。

L2范数：

　L2范数符合高斯分布，是完全可微的。和L1相比，图像上的棱角被圆滑了很多。一般最优值不会在坐标轴上出现。在最小化正则项时，可以是参数不断趋向于0，最后活的很小的参数。

　假设要求的参数为θθ，hθ(x)hθ(x)是我们的假设函数，那么线性回归的代价函数如下：

　那么在梯度下降法中，最终用于迭代计算参数θj的迭代式为：

如果在原始代价函数之后添加L2正则化，则迭代公式会变成下面的样子：

　每一次迭代，θj都要先乘以一个小于1的因子，从而使得θj不断减小，因此总得来看，θ是不断减小的。

通过以上分析可得：

如果需要使用稀疏解进行有效的特征选择，更加适合选用L1;如果单一的考虑简化模型复杂度，提升泛化能力，一般选用L2。

参考链接：

1、L1，L2正则化的理解

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
L1，L2正则化

一、概括：L1和L2是正则化项，又叫做罚项，是为了限制模型的参数，防止模型过拟合而加在损失函数后面的一项。机器学习中，如果参数过多，模型过于复杂，容易造成过拟合（overfit）。即模型在训练样本数据上表现的很好，但在实际测试样本上表现的较差，不具备良好的泛化能力。为了避免过拟合，最常用的一种方法是使用使用正则化，例如 L1 和 L2 正则化。我们知道，正则化的目的是限制参数过多或者过大，...
复制链接

扫一扫

专栏目录

yeler082 CSDN认证博客专家 CSDN认证企业博客

码龄7年

223: 原创

3万+: 周排名

213万+: 总排名

113万+: 访问

: 等级

9252: 积分

336: 粉丝

653: 获赞

185: 评论

3255: 收藏

私信

关注

热门文章

分类专栏

最新评论

Mathpix Snip--图片中识别公式
头发慢点掉的小马: 想问一个这个发送的https请求，不会报ssl错误吗？我用这个示例进行请求输出的是不合法的验证：{ "error": "Invalid credentials", "error_info": { "id": "http_unauthorized", "message": "Invalid credentials" } }
过拟合欠拟合与交叉验证集说明
不抽烟不喝酒只烫头: 有对应的APi的；5折就是说训练一次会跑5*epochs次训练；把整个数据集随机均分成5个不相交的子集，然后分别取出其中的一份做测试集，剩余4份做训练集，练5次，每次练完都重新弄一个新的模型练下一折，全面评估模型在数据集上的泛化能力。
过拟合欠拟合与交叉验证集说明
我要赶紧毕业找到好工作: 请问博主，交叉验证数据集是什么意思呢？如果要训练5折交叉验证，那么是不是划分出20%的测试集之后，用剩下的60%做为训练验证的数据呢
深度学习框架究竟是什么？
birdNet23: 博主写的很好啊，支持
图像噪声简介
weixin_37129364: 您好，作者，请问4中的乘性噪声是怎么添加的，有代码？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。