- 方向导数
函数 在 处,方向 的方向导数:
当方向导数 关于 线性的,即,那么我们称 在 这一点 Gâteaux differentive,并且
导数.。
- 次梯度与次微分
令 是一个凸的且合适的函数,即 (域空间非空),在 , 如果 满足,对任意,
就说 是 在 这一点的次梯度 。
例1,对于 , 在 0 这一点:
,
容易求得:, 因此这个集合中的任一点都是这一点的次梯度,这个集合就叫次微分。
例2,对于 = ,在 0 这一点,
, ,
可以看出对于光滑的函数,次梯度就等于通常意义上的梯度。
- 次梯度应用
次梯度有如下重要性质:
对于任何凸且合适的函数 ,点 是 的极值点,当且仅当满足条件 , 即 0 要是函数在这一点的次梯度。
例1: proximal mapping
,
1. 当; while
2. 当 while ;
3. 当;while ;
- 矩阵范数次微分
令 是矩阵范数,如果 是 维实矩阵,那么 的次微分被如下定义:
可以看到和函数次微分的定义本质上是一样的。
在这里主要考虑正交不变范数,即 , 是正交的。对于这一类范数,可以通过它的奇异值来定义。对A
做奇异值分解,,奇异值按降序排列,,所有这一类范数可以定义成奇异值的函数,,
。例如当 是 norm,可以得到 。当p=1,定义了核范数;当p=2,定义了Frobenius 范数;当
p=,最大奇异值,定义了谱范数,等等。对于这一类通过奇异值定义的范数,有如下定理:
Theorem 1. 方向导数
令 A,R 均为 的矩阵,对A 做奇异值分解,则A 的方向导数为:
均是相对于 的奇异向量。
Theorem 2. 次微分
令D 是 的对角矩阵,则矩阵 A 的范数的次微分为:
D是对角矩阵,对角元素是 的次梯度。conv是集合的convex hull, 即集合中元素的凸组合,对于一个矩阵来说,做奇异值分解时奇异值是唯一的,但奇异向量矩阵U和V不唯一。上式中,次微分中的任一元素 ,即次梯度,可以表示为:
,
例1. 核范数 。
对A做奇异值分解,,当 A 有s个0奇异值时,。那么对角矩阵的前 n-s个对角元素为1,后s个元素的绝对值小于等于1.将划分成 ,划分成 , 有n-s个列。
让, 然后
其中,, , 是对角矩阵,对角元素是 的次梯度。
由于不同奇异向量相差一个正交矩阵,因此,
这里 分别是n-s,m-n+s,s维的正交矩阵。 是维的对角矩阵,表示矩阵最大奇异值。
最后,可以得到: