L1正则为什么更容易获得稀疏解

最新推荐文章于 2025-03-23 18:15:53 发布

keep_forward

最新推荐文章于 2025-03-23 18:15:53 发布

阅读量2.1w

点赞数 86

分类专栏： machine learning 文章标签： L1 正则稀疏特征选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/b876144622/article/details/81276818

版权

machine learning 专栏收录该内容

20 篇文章

订阅专栏

L1和L2正则常被用来解决过拟合问题。而L1正则也常被用来进行特征选择，主要原因在于L1正则化会使得较多的参数为0，从而产生稀疏解，将0对应的特征遗弃，进而用来选择特征。

但为什么L1正则会产生稀疏解呢？这里利用公式进行解释。
假设只有一个参数为 $w$ ，损失函数为 $L (w)$ ，分别加上L1正则项和L2正则项后有：

$J_{L1}(w) = L(w) + \lambda \lvert w \rvert$
$J_{L2}(w) = L(w) + \lambda w^2$

假设 $L (w)$ 在0处的导数为 $d_0$ ，即
$\frac{\partial L(w)}{\partial w} \bigg |_{w=0} =d_0$

则可以推导使用L1正则和L2正则时的导数。

引入L2正则项，在0处的导数
$\frac{\partial J_{L2}(w)}{\partial w} \bigg |_{w=0} =d_0 + 2 \times \lambda \times w = d_0$

引入L1正则项，在0处的导数
$\frac{\partial J_{L1}(w)}{\partial w} \bigg |_{w=0^-} =d_0 - \lambda$

$\frac{\partial J_{L1}(w)}{\partial w} \bigg |_{w=0^+} =d_0 + \lambda$

可见，引入L2正则时，代价函数在0处的导数仍是 $d_0$ ，无变化。而引入L1正则后，代价函数在0处的导数有一个突变。从 $d_0 + \lambda$ 到 $d_0 - \lambda$ ，若 $d_0 + \lambda$ 和 $d_0 - \lambda$ 异号，则在0处会是一个极小值点。因此，优化时，很可能优化到该极小值点上，即 $w = 0$ 处。

这里只解释了有一个参数的情况，如果有更多的参数，也是类似的。因此，用L1正则更容易产生稀疏解。

博客等级

码龄13年

113
原创

612
点赞

1697
收藏

112
粉丝

关注

私信

热门文章

分类专栏

recom 3篇
深度学习推荐系统读书笔记 3篇
charge
home
excel
leetcode
algorithms 3篇
python 22篇
deeplearning 10篇
caffe 16篇
linux 16篇
tensorflow 13篇
office 3篇
machine learning 20篇
markdown
git 3篇
putty 1篇
c/cpp 6篇
make 2篇
other
mathematics 1篇

展开全部收起

最新评论

tensorflow 恢复部分参数、加载指定参数
流木追风: 还可以通过tf.compat.v1.get_collection(tf.compat.v1.GraphKeys.GLOBAL_VARIABLES, scope=<name_scope>)方法读取特定name_scope的参数变量信息
Makefile中:=, =, ?=和+=的含义
gerdios: 个人理解：可以用时间轴的概念辅助理解，设想一个时间轴，有第1赋值点，现在赋值点和下一赋值点三个点，现在处于当前赋值点，那么 “=” 赋值后，变量的值将影响第1赋值点直到下一赋值点前的变量值；“:=” 仅影响当前赋值点到下一赋值点前的变量值；"?=" 仅在第1赋值点有效，其余赋值点则忽略
Makefile中:=, =, ?=和+=的含义
clearmann: 没有必要，这不是应试考试，大家都会避免写有歧义的代码
Makefile中:=, =, ?=和+=的含义
TT_str: 如果先=后:=会怎么样如果先:=后=会怎么样
Makefile中:=, =, ?=和+=的含义
找bug小能手zz: 通俗易懂，感谢

最新文章

目录

展开全部

收起

评论 17

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。