次梯度（subgradient）方法

最新推荐文章于 2024-07-02 14:22:20 发布

nana-li

最新推荐文章于 2024-07-02 14:22:20 发布

阅读量1.7w

点赞数 11

分类专栏： Machine Learning 文章标签：次梯度方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/quiet_girl/article/details/79648124

版权

Machine Learning 专栏收录该内容

52 篇文章 23 订阅

订阅专栏

写在前面

本篇博客来自其他几篇博客的整合（详见参考文献），主要是提取了一些利于自己理解的小点。

一、为什么需要次梯度方法

次梯度方法是传统梯度下降算法的拓展，传统梯度下降算法是为了解决可导凸函数的问题，而次梯度方法主要是为了解决不可导梯度的问题。但是其算法收敛速度会相对较慢。

二、次梯度的定义

次梯度是指对于函数 $f$ 上的点 $x$ 满足一下条件的 $g \in \mathbb{R}^n$ :

f(y)≥f(x)+gT(y−x) f ( y ) ≥ f ( x ) + g T ( y − x ) $f(y) \geq f(x) + g^T(y-x)$
即，
（1）若

f f $f$ 是一个凸函数，若

f

$f$ 在x处可导，则由一阶泰勒展开式：

f(y)≥f(x)+▽f(x)T(y−x) f ( y ) ≥ f ( x ) + ▽ f ( x ) T ( y − x ) $f(y) \geq f(x) + \bigtriangledown f(x)^T(y-x)$
（2）若

f f $f$ 在x处不可导，则仍可得到一个下届：

f (y) \geq f (x) + g^{T} (y - x)

$f(y) \geq f(x) + g^T(y-x)$
这个

g g $g$ 就是

f

$f$ 的子梯度。
注意：虽然次梯度是针对不可导函数而设计的，但是可导函数也仍然可以使用，因此

f f $f$ 是非凸函数也是可以的。

三、次梯度的计算方法

在点 $x_0$ 的次导数的集合是一个非空闭区间[a, b]，其中a和b是单侧极限
$a=\lim_{x->x_0^-}\frac{f(x)-f(x_0)}{x-x_0}$ ， $a=\lim_{x->x_0^+}\frac{f(x)-f(x_0)}{x-x_0}$
a和b一定存在，且a≤b。所有次导数的集合[a, b]称为函数 $f$ 在 $x_0$ 的次导数。

四、次梯度的举例

$f(x)=|x|$ 在 $x=0$ 的次梯度为[-1, 1]。
$a=\lim_{x->0^-}\frac{|x|-0}{x}=\frac{-x}{x}=-1$ ，
$b=\lim_{x->0^+}\frac{|x|-0}{x}=\frac{x}{x}=1$
因此， $f(x)=|x|$ 在 $x=0$ 的次梯度为[-1, 1]。

五、次梯度的性质

数乘不变性。 $\forall \alpha≥0, \partial(\alpha f)(x)=\alpha \partial f(x)$
加法不变性。 $f=f_1+...+f_m, \partial f(x)=\partial f_1(x)+...+\partial f_m(x)$
放射特性。如果 $f$ 是凸函数，那么 $\partial f(Ax+b)=A^T \partial f(Ax+b)$

六、次梯度算法

次梯度算法与梯度下降类似，仅仅是使用次梯度代替梯度，即：
$x^{(k)}=x^{(k-1)}-t_k \cdot g^{(k-1)}, k=1,2,3...$
其中， $g^{(k-1)} \in \partial f(x^{(k-1)})$ 为 $f(x)$ 在x处的次梯度。
与梯度下降算法不同的地方在于，次梯度算法并不是下降算法，每次对于参数的更新并不能保证代价函数是呈单调递减的趋势。

参考文献：
https://www.52ml.net/20973.html
https://blog.csdn.net/lansatiankongxxc/article/details/46386341
https://www.cnblogs.com/connorzx/p/4797194.html

关注

11
点赞
踩
79

收藏

觉得还不错? 一键收藏
12
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。