l1正则化表达式_L1正则化相比L2正则化更能得到稀疏解的巧妙解释

最新推荐文章于 2024-04-19 08:50:23 发布

内酷少女

最新推荐文章于 2024-04-19 08:50:23 发布

阅读量372

点赞数

文章标签： l1正则化表达式

本文链接：https://blog.csdn.net/weixin_35793067/article/details/112525105

版权

本学期是机器学习课的助教，布置作业过程中看到这个有趣的问题。

考虑一个非常简单的优化问题

L2正则化约束

加上L2正则化约束后，优化问题变成了

，该问题的最优解为

，当且仅当

时，最优解为0.

L1正则化约束

加上L1正则化约束后，优化问题成为

，简单分类讨论一下，有三种情况：

其中，

时，最优解均为0.

总结

由此可以看到，采用L1正则化，最优解为0的条件为

；而在L2正则化时，最优解为0当且仅当

。所以，

采用L1正则化，最优解为0的概率极大增加，这使得得到的解更可能是稀疏的。

这里仅对一维的简单情况进行了分析，但是它可以拓展到高维情况，以至于一般的线性回归的情况。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

内酷少女

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【AI面试】回归损失横评：L1 loss、L2 loss和Smooth L1 Loss，L1正则化和L2正则化、IOU loss系列

钱多多先森

05-03

2053

损失函数是深度学习模型优化的一个灵魂基础，所以无论是很新的transform模型，还是比较早期的AlexNet，都不可避免的要涉及到损失函数的设计和应用。所以，各种形形色色的损失函数（Loss）也就成了面试场上，不经意间就会被牵扯到的问题。其中，目标检测任务的损失函数由Classificition Loss和Bounding Box Regeression Loss两部分构成。本次我们着重关注BoundingBox Loss 目标检测回归损失，之后有时间我们关注分类等损失函数。 1. L1 loss、

【问题记录】AttributeError: module ‘tensorflow‘ has no attribute ‘global_variables_initializer‘ | L1和L2正则化

追光者♂：记录、分享、总结、提升，现象级专栏《Python从入门到人工智能》作者，无惧黑暗，坚信曙光

11-02

579

问题记录与解决。【问题记录】AttributeError: module ‘tensorflow‘ has no attribute ‘global_variables_initializer‘ | 人工智能面试题：解释一下L1正则化和L2正则化的区别和作用。

参与评论您还未登录，请先登录后发表或查看评论

L1正则化理论推导，为什么L1产生稀疏解?

01-06

L1正则化技术F(w;x,y)=J(w;x,y)+α∣∣w∣∣1=J(w;x,y)+α∑i=1n∣wi∣假设w∗是损失函数J(w;x,y)最优解，J(w;x,y)在w∗处泰勒展J(w;x,y)=J(w∗;x,y)+J′(w∗;x,y)(w−w∗)+12!J′′(w∗;x,y)(w−w∗)2 ∵w∗是J(w;x,y)最优解，则J′(w∗;x,y)=0，则可以去除J(w∗;x,y)+12!J′′(w∗;x,y)(w−w∗)2J′′是二阶导数，当是高维的时候就变成了H矩阵了。J(w∗;x,y)+12!H(w−w∗)2∴F(w;x,y)=J(w;x,y)+α∣∣w∣∣1=J(w∗;x,y)+12!H

L1正则能够得到稀疏解

junjian Li

04-01

2022

在复习到过拟合的解决方法的时候L1正则化和L2正则化都可以用于降低过拟合的风险，但是L1正则化还会带来一个额外的好处：它比L2正则化更容易获得稀疏解，也就是说它求得的w权重向量具有更少的非零分量。主要就其为什么可以防止过拟合总结一下，相当于写个小笔记。首先L1和L2正则降低了模型的复杂度，是对模型复杂度的惩罚。并且L1正则能够得到稀疏解，L2正则能够得到平滑解。 1、首先为什么L1正则能够得到稀疏解呢？ 1.1 用图解释： l1正则用一个菱形去逼近目标，而l2正则用一个圆形去逼近目标，所以在逼近的过程过，

L1正则化比L2正则化更易获得稀疏解的原因

weixin_30414155的博客

09-16

627

　　我们知道L1正则化和L2正则化都可以用于降低过拟合的风险，但是L1正则化还会带来一个额外的好处：它比L2正则化更容易获得稀疏解，也就是说它求得的w权重向量具有更少的非零分量。　　为了理解这一点我们看一个直观的例子：假定x有两个属性，于是无论是采用L1正则化还是采用L2正则化，它们解出的w权重向量都具有两个分量，即w1,w2；我们将其作为两个坐标轴，然后在这个二维空间中绘制平方误差取值相...

L1正则化——为什么具有稀疏性呢？

最新发布

qlkaicx的博客

04-19

1011

首先，L1正则化的正则化项是权重向量的绝对值之和。在优化过程中，这个正则化项会引导模型尽量将某些权重压缩为零。这是因为最小化L1正则化项（即权重向量的绝对值之和）的过程中，优化算法会倾向于让不太重要的权重趋于零。其次，从几何角度来看，L1正则化在优化过程中用一个菱形去逼近目标。这种逼近方式使得L1正则化更容易在坐标轴和目标相交，因此更容易得到稀疏解，即权重向量的某些分量可能为零。

L1正则使得模型的解稀疏

xiaojiajia007的博客

05-27

372

下图给出目标函数 y=x3+2x−3x3+0.5 y=x^{3}+2x-3x^{3}+0.5 y=x3+2x−3x3+0.5 在添加了L1正则项和L2正则项后解的变化情况 L1正则2.5∣x∣L2正则2.5x2 L1正则 2.5\left| x \right|\\ L2正则 2.5x^{2} L1正则2.5∣x∣L2正则2.5x2 可以看到，因为有了L1正则，使得原始代价函数的解变成了现在的0，即...

L1_L1正则化_

10-03

对于L1正则化，这种算法可以导致某些参数变为0，即产生稀疏解。在实际应用中，L1正则化常用于特征选择。由于它倾向于使部分权重为0，可以用来进行变量选择，降低模型复杂度，提高模型解释性。在大数据或高维数据...

tensorflow使用L2 regularization正则化修正overfitting过拟合方式

12-17

与L1正则化（L1范数约束）不同，L2正则化倾向于产生连续的权重，而不是稀疏解。L1正则化通过求解绝对值最小的权重，常常导致某些权重参数为零，从而实现特征选择，但这也可能降低模型的拟合能力。L1正则化通常用于...

L1正则化在自然语言处理中的应用

AI天才研究院

04-06

958

L1正则化在自然语言处理中的应用作者：禅与计算机程序设计艺术 1. 背景介绍自然语言处理(Natural Language Processing, NLP)是人工智能和计算机科学领域的一个重要分支,旨在让计算机能够理解、分析和生成人类语言。在NLP中,我们经常会遇到大量的

L1正则为什么更容易获得稀疏解

05-20

250

Spark2.0机器学习系列之12：线性回归及L1、L2正则化区别与稀疏解

热门推荐

qq_34531825的博客

09-28

1万+

我的博客中参考了大量的文章或者别的作者的博客，有时候疏忽了并未一一标注，本着分享交流知识的目的，如果侵犯您的权利，这并非我的本意，如果您提出来，我会及时改正。概述线性回归拟合一个因变量与一个自变量之间的线性关系y=f(x)y=f(x)。 Spark中实现了：（1）普通最小二乘法（2）岭回归（L2正规化）（3）Lasso（L1正

L1、L2正则化与稀疏性

qq_34120015的博客

03-28

2166

禁止转载，谢谢！ 1.正则化（Regularization）的基本概念 - 什么是正则化/如何进行正则化 定义：在机器学习中正则化（regularization）是指在模型的损失函数中加上一个正则化项，也称为惩罚性（penalty term）： 1N∑i=1NL(yi,f(xi))+λJ(f)\frac{1}{N}\sum^{N}_{i=1}L(y_i,f(x_i))+\lambda J{(f)}N1i=1∑NL(yi,f(xi))+λJ(f) 其中L为损失函数，J为正则化项。通常来说，.

L1和L2正则化与稀疏性

sunlanchang的博客

10-25

480

参考 https://zhuanlan.zhihu.com/p/50142573 参考用图解释和用导数解释

看图就懂:为什么L1正则化比L2正则化更容易得到稀疏解？为什么L2正则化可以用于防止过拟合？

轩逸云的博客

01-16

3068

相信大部分人都见到过，下面的这两张对比图，用来解释为什么L1正则化比L2正则化更容易得到稀疏解，然而很多人会纠结于"怎么证明相切是在角点上？"，呃，不必就纠结于此，请注意结论中的"容易"二字，配图只是为了说明"容易"而已。假设x仅有两个属性，即w只有两个分量w1,w2，稀疏解->w1=0或w2=0，即w的等值线与平方误差等值线的切点位于坐标轴。事实上L1与L2均可以实现与平方误差等值线的切点位于坐标轴上，只不过L2需平方误差等值线的"中心点"位于坐标...

l1正则化表达式_L1 正则化与嵌入式特征选择 (稀疏性)

weixin_28950415的博客

02-17

416

L1 正则化与嵌入式特征选择 (稀疏性)岭回归的历史可追溯到 1943 年由 A.Tikhonov 发表在苏联科学院院刊上的一篇文章, 我们知道计算机是在 1946 年发明出来的, 由此可见, 这是一个历史悠久的算法, 至今依旧有生命力, 属于经典算法之一岭回归, 是线性回归的 L2 正则化方式本质上是一种回归给定数据集 D = {(x1,y1),(x2,y2),...,(xm,ym)}, 其中 ...

最优化方法：L1和L2正则化regularization

摩登都市天空---专栏

08-21

9634

1. 正则化（Regularization）机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，一般英文称作 ℓ1-norm和ℓ2-norm，中文称作L1正则化和L2正则化，或者L1范数和L2范数。 L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型，使用L1正则化的模型建叫做Lasso回归，使用L...

为什么L1正则化比L2正则化更容易获得稀疏解

Ahead_J的博客

12-19

2079

先说结论，通过L1正则化更容易获得稀疏的w解，通过L2正则化更容易获得平滑的w解以下解释来自于知乎https://www.zhihu.com/question/37096933

L1正则化相比于L2为什么更容易获得稀疏解

Accepted ALL lve

08-30

553

作者：王赟 Maigo 链接：https://www.zhihu.com/question/37096933/answer/70426653 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。假设费用函数 L 与某个参数 x 的关系如图所示：则最优的 x 在绿点处，x 非零。现在施加 L2 regularization，新的费用函数（L+C...

L1正则化Logistic回归提升财务预警准确性和解释性

相比于传统的L2正则化Logistic回归，L1正则化以其特有的稀疏性优势，能够自动剔除那些对模型预测贡献较小的特征，从而提高模型的解释性和经济含义。这意味着在保证模型预测精度的同时，L1正则化能够帮助决策者更加...