L1正则化和L2正则化

最新推荐文章于 2024-05-16 15:56:00 发布

qq_35482604

最新推荐文章于 2024-05-16 15:56:00 发布

阅读量473

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35482604/article/details/105322971

版权

L1标准化与L2标准化在这里插入图片描述

参考：l1、l2标准化及其python代码实现

L1正则化和L2正则化

我们知道，正则化的目的是限制参数过多或者过大，避免模型更加复杂。
在这里插入图片描述

L1 与 L2 解的稀疏性

在这里插入图片描述
以二维情况讨论，上图左边是 L2 正则化，右边是 L1 正则化。从另一个方面来看，满足正则化条件，实际上是求解蓝色区域与黄色区域的交点，即同时满足限定条件和 Ein 最小化。对于 L2 来说，限定区域是圆，这样，得到的解 w1 或 w2 为 0 的概率很小，很大概率是非零的。

对于 L1 来说，限定区域是正方形，方形与蓝色区域相交的交点是顶点的概率很大，这从视觉和常识上来看是很容易理解的。也就是说，方形的凸点会更接近 Ein 最优解对应的 wlin 位置，而凸点处必有 w1 或 w2 为 0。这样，得到的解 w1 或 w2 为零的概率就很大了。所以，L1 正则化的解具有稀疏性。

在这里插入图片描述

正则化参数 λ

正则化是结构风险最小化的一种策略实现，能够有效降低过拟合。损失函数实际上包含了两个方面：一个是训练样本误差。一个是正则化项。其中，参数 λ 起到了权衡的作用。

在这里插入图片描述
以 L2 为例，若 λ 很小，对应上文中的 C 值就很大。这时候，圆形区域很大，能够让 w 更接近 Ein 最优解的位置。若 λ 近似为 0，相当于圆形区域覆盖了最优解位置，这时候，正则化失效，容易造成过拟合。相反，若 λ 很大，对应上文中的 C 值就很小。这时候，圆形区域很小，w 离 Ein 最优解的位置较远。w 被限制在一个很小的区域内变化，w 普遍较小且接近 0，起到了正则化的效果。但是，λ 过大容易造成欠拟合。欠拟合和过拟合是两种对立的状态。

【通俗易懂】机器学习中 L1 和 L2 正则化的直观解释

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1正则化和L2正则化

参考：l1、l2标准化及其python代码实现L1正则化和L2正则化我们知道，正则化的目的是限制参数过多或者过大，避免模型更加复杂。【通俗易懂】机器学习中 L1 和 L2 正则化的直观解释...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。