【矩阵求导】对于复向量l1-norm 1范数的求导

最新推荐文章于 2023-01-17 21:50:02 发布

B417科研笔记

最新推荐文章于 2023-01-17 21:50:02 发布

阅读量5.9k

点赞数 4

分类专栏：数学推导

本文链接：https://blog.csdn.net/weixin_39274659/article/details/114693200

版权

数学推导专栏收录该内容

19 篇文章 28 订阅

订阅专栏

$l_1$ -norm，作为 $l_0$ -norm 的最紧凸近似，在压缩感知中非常常用。
例如求解问题：
$\mathrm{argmin}_x Ax = b \quad \mathrm{s.t.} |x|_0\le n$
即待求解向量 $x$ 是一个稀疏向量，其非零元素个数不超过 $n$ 个。
一种基于LASSO的做法是将问题改写为：
$\mathrm{argmin}_x ||Ax-b||_2^2 + \lambda |x|_1$
其中 $\lambda$ 是一个人工变量，可通过改变其大小改变对稀疏条件的重视程度。注意，这里将不可导、非凸的零范数放松为了一范数。也因此，改写后的问题是一个可导的问题。

最简单的情况下， $x$ 为实数向量。此时， 1-范数的导数很容易由定义得到： $|x|_1=\sum |x_i|$ , $\frac{\partial |x|_1}{x_i} = \mathrm{sign}(x_i)$ .

本文考虑的是通信中更常见的情形， 即 $x$ 是一个复数向量。
此时， $x_i|$ 不再是 $x_i$ 的绝对值，而是复数 $x_i$ 的模，即 $\sqrt{x_ix_i^*}$ .
也就是说：(复数时求梯度为对变量的共轭求导）
$\frac{\partial |x|_1}{\partial x_i^*}=\frac{\partial \sum \sqrt{x_ix_i^*}}{\partial x_i^*} = \frac{(x_i)^\frac{1}{2}(x^*_i)^{-\frac{1}{2}}}{2}.$

进一步更复杂一些的：
设 $f = |Ax|_1$ ，求 $\frac{\partial f}{\partial x^*}$ 。
设 $A$ 的第 $i$ 行为 $a_i$ , 那么 $Ax]_i=a_ix$ , $|[Ax]_i|=(x^Ha_i^Ha_ix)^{\frac{1}{2}}$ , 因此，
$\sum (x^Ha_i^Ha_ix)^{\frac{1}{2}}$
对 $f$ 求微分，有：
$df=d\mathrm{tr}(\sum (x^Ha_i^Ha_ix)^{\frac{1}{2}})=\mathrm{tr}(\sum d(x^Ha_i^Ha_ix)^{\frac{1}{2}})$
而：
$d(x^Ha_i^Ha_ix)^{\frac{1}{2}} = \frac{1}{2}(x^Ha_i^Ha_ix)^{-\frac{1}{2}}(d x^H) a_i^Ha_ix$
代回，得：
$=\mathrm{tr}(\sum \frac{1}{2}(x^Ha_i^Ha_ix)^{-\frac{1}{2}}a_i^Ha_ix(d x^H) )$
因此，
$\frac{\partial f}{\partial x^*} =\frac{1}{2} \sum (x^Ha_i^Ha_ix)^{-\frac{1}{2}}a_i^Ha_ix.$

再进一步的，设 $|\mathrm{vec}(A^HXA)|_1$ ，求 $\frac{\partial f}{\partial X^*}$ 。
（注意，如果 $X$ 是一个稀疏矩阵，那么对其0范数的近似并不是直接 $X$ 的1范数，而是 $X$ 向量化后的1范数。因为一个矩阵的1范数是每列1范数的最大值，而不是所有元素模的和。）

设 $A$ 的第 $i$ 列为 $a_i$ , 那么 $A^HXA]_{ij} = a_i^HXa_j$ , 由于 $f$ 代表矩阵每个元素的模的和，因此
$\sum_i\sum_j(a_j^HX^Ha_ia_i^HXa_j)^{\frac{1}{2}}$
同样地，对 $f$ 求微分，有：

$=d\mathrm{tr}(\sum_i\sum_j(a_j^HX^Ha_ia_i^HXa_j)^{\frac{1}{2}})=\mathrm{tr}(\sum_i\sum_j d(a_j^HX^Ha_ia_i^HXa_j)^{\frac{1} {2}})$

而：
$d(a_j^HX^Ha_ia_i^HXa_j)^{\frac{1}{2}} = \frac{1}{2}(a_j^HX^Ha_ia_i^HXa_j)^{-\frac{1}{2}}a_j^H(dX^H)a_ia_i^HXa_j$ , 代回得

$\mathrm{tr}(\sum_i\sum_j \frac{1}{2}(a_j^HX^Ha_ia_i^HXa_j)^{-\frac{1}{2}}a_ia_i^HXa_ja_j^H(dX^H))$
因此，
$\frac{\partial f}{\partial X^*} = \sum_i\sum_j \frac{1}{2}(a_j^HX^Ha_ia_i^HXa_j)^{-\frac{1}{2}}a_ia_i^HXa_ja_j^H.$

B417科研笔记

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
1
评论
【矩阵求导】对于复向量l1-norm 1范数的求导

l1l_1l1-norm，作为 l0l_0l0-norm 的最紧凸近似，在压缩感知中非常常用。例如求解问题：argminxAx=bs.t.∣x∣0≤n\mathrm{argmin}_x Ax = b \quad \mathrm{s.t.} |x|_0\le nargminxAx=bs.t.∣x∣0≤n即待求解向量xxx是一个稀疏向量，其非零元素个数不超过nnn个。一种基于LASSO的做法是将问题改写为：argminx∣∣Ax−b∣∣22+λ∣x∣1\mathrm{argmin}_x |
复制链接

扫一扫