L1正则化求导问题

最新推荐文章于 2024-05-18 20:08:10 发布

梅mmmmm

最新推荐文章于 2024-05-18 20:08:10 发布

阅读量1.7w

点赞数 5

分类专栏：机器学习文章标签：正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mei86233824/article/details/79181377

版权

L1正则化求导问题

在实现机器学习算法时，最常用的是L2正则化，因为L2正则化有连续可微的性质，易求导。但L1能产生稀疏解，而且稀疏解的泛化能力会比较好，不过由于L1正则化并不是处处连续的，所以优化的时候会有一定难度。
对于目标函数不是连续可微的情况，可以用次梯度来进行优化，但次梯度存在两个问题：

求解慢
通常不会产生稀疏解

次梯度定义：次梯度，次导数

此时可以用 Proximal Algorithm 对L1进行求解。

Proximal Algorithm

定义如下：
设 $f:R^n\rightarrow R \cup\{+\infty\}$ 为凸函数，那么凸函数的 上镜图（epigraph） 定义为：

e p i f = {(x, t) \in R n \times R | f (x) < + \infty}

$epi\ f=\{(x,t)\in R^n\times R|f(x)<+\infty \}$
是非空的闭凸集，其 effective domain ：

d o m f = {x \in R n | f (x) < + \infty}

$dom\ f=\{x\in R^n |f(x)<+\infty\}$
即，

f f $f$ 的取值范围为有限个的一组点。

上镜图（epigraph）意为在函数图像之上。一个用途是用来联系凸集合凸函数的。即，一个函数为凸函数，当且仅当其上镜图是凸集。

proximal operator Prox $_f:R^n\rightarrow R^n$ 的定义：

p r o x f (v) = arg min x (f (x) + 1 2 ‖ x - v ‖ 22)

$prox_f(v)=\arg \min_x(f(x)+\frac{1}{2}\|x-v\|^2_2)$
$或者$ $或者$
$p r o x λ f (v) = arg min x$

最低0.47元/天解锁文章

关注

5
点赞
踩
30

收藏

觉得还不错? 一键收藏
2
评论
L1正则化求导问题

L1正则化求导问题在实现机器学习算法时，最常用的是L2正则化，因为L2正则化有连续可微的性质，易求导。但L1能产生稀疏解，而且稀疏解的泛化能力会比较好，不过由于L1正则化并不是处处连续的，所以优化的时候会有一定难度。对于目标函数不是连续可微的情况，可以用次梯度来进行优化，但次梯度存在两个问题：求解慢通常不会产生稀疏解次梯度定义：次梯度，次导数此时可以用 Proximal ...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。