次导数 次梯度 小结

项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步

1.导数(Derivative)的定义

在说次梯度之前,需要先简单介绍一下导数的概念与定义。导数(英语:Derivative)是微积分学中重要的基础概念。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。导数的本质是通过极限的概念对函数进行局部的线性逼近。
对于一般的函数 f ( x ) f(x) f(x),其导数为:
f ′ ( x ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f'(x) = \lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta x} = \lim_{\Delta x \rightarrow 0} \frac{f(x_0+\Delta x) - f(x_0)}{\Delta x} f(x)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)

如果不使用增量, f ( x ) f(x) f(x) x 0 x_0 x0处的导数 也可以定义为:当定义域内的变量 x x x趋近于 x 0 x_0 x0时,
f ′ ( x ) = f ( x ) − f ( x 0 ) x − x 0 f'(x) = \frac{f(x) - f(x_0)}{x - x_0} f(x)=xx0f(x)f(x0)

2.次导数(subderivative)

次导数(subderivative)、次微分(subdifferential)、次切线(subtangent lines)和次梯度(subgradient)的概念出现在凸分析,也就是凸函数的研究中。

设f:I→R是一个实变量凸函数,定义在实数轴上的开区间内。这种函数不一定是处处可导的,例如最经典的例子就是 f ( x ) = ∣ x ∣ f(x) = |x| f(x)=x,在 x = 0 x=0 x=0处不可导。但是,从下图的可以看出,对于定义域内的任何 x 0 x_0 x0,我们总可以作出一条直线,它通过点 ( x 0 , f ( x 0 ) ) (x_0, f(x_0)) (x0,f(x0)),并且要么接触f的图像,要么在它的下方。这条直线的斜率称为函数的次导数。

这里写图片描述

3.次导数与次微分(subdifferential)计算方式

凸函数f:I→R在点x0的次导数,是实数c使得:
f ( x ) − f ( x 0 ) ≥ c ( x − x 0 ) f(x) - f(x_0) \geq c(x - x_0) f(x)f(x0)c(xx0)
对于所有I内的x。我们可以证明,在点x0的次导数的集合是一个非空闭区间[a, b],其中a和b是单侧极限
a = lim ⁡ x → x 0 − f ( x ) − f ( x 0 ) x − x 0 a = \lim_{ x \rightarrow x_0^-} \frac{f(x)-f(x_0)}{x - x_0} a=xx0limxx0f(x)f(x0)
b = lim ⁡ x → x 0 + f ( x ) − f ( x 0 ) x − x 0 b = \lim_{ x \rightarrow x_0^+} \frac{f(x)-f(x_0)}{x - x_0} b=xx0+limxx0f(x)f(x0)

它们一定存在,且满足a ≤ b。
所有次导数的集合 [ a , b ] [a, b] [a,b]称为函数 f f f x 0 x_0 x0的次微分。

例如:考虑凸函数 f ( x ) = ∣ x ∣ f(x)=|x| f(x)=x。在原点的次微分是区间[−1, 1]。 x 0 < 0 x_0<0 x0<0时,次微分是单元素集合{-1},而 x 0 > 0 x_0>0 x0>0,则是单元素集合{1}。

4.性质及推广

1.凸函数f:I→R在x0可导,当且仅当次微分只由一个点组成,这个点就是函数在 x 0 x_0 x0的导数。
2.点 x 0 x_0 x0是凸函数f的最小值,当且仅当次微分中包含零,也就是说,在上面的图中,我们可以作一条水平的“次切线”。这个性质是“可导函数在极小值的导数是零”的事实的推广。

5.次梯度

次导数和次微分的概念可以推广到多元函数。如果f:U→ R是一个实变量凸函数,定义在欧几里得空间Rn内的凸集,则该空间内的向量v称为函数在点x0的次梯度,如果对于所有U内的x,都有:
f ( x ) − f ( x 0 ) ≥ v ⋅ ( x − x 0 ) f(x) - f(x_0) \geq v \cdot(x - x_0) f(x)f(x0)v(xx0)
所有次梯度的集合称为次微分,记为 ∂ f ( x 0 ) ∂f(x_0) f(x0)。次微分总是非空的凸紧集。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值