核范数学习

Nightmare004

已于 2022-09-06 09:42:46 修改

阅读量2.2k

点赞数 4

分类专栏：数学文章标签：核范数奇异值齐次性三角不等式矩阵运算

于 2022-05-17 14:48:30 首次发布

本文链接：https://blog.csdn.net/qq_39942341/article/details/124816164

版权

数学专栏收录该内容

144 篇文章 19 订阅

订阅专栏

设 $\mathbf{A}\in\mathbb{R}^{m\times n}$ ,
核范数定义:
$\|\mathbf{A}\|_{*}=\sum_{i=1}^{\min\left\{m,n\right\}}\sigma_i=\sum_{i=1}^{r}\sigma_i=\operatorname{tr}\left(\sqrt{\mathbf{A}^T\mathbf{A}}\right)$
其中 $\sigma_i$ 为奇异值, $r=\operatorname{rank}\left(\mathbf{A}\right)$

接下来证明核范数是一个范数
设奇异值 $\sigma_1\ge \sigma_2\ge\cdots\ge \sigma_r\ge \sigma_{r+1}=\cdots=\sigma_{\min\left\{m,n\right\}}= 0$
非负性：
$\sigma_i\ge 0$
当 $\mathbf{A}\neq 0$ 时， $\sigma_1>0$ ,所以 $\|\mathbf{A}\|_*>0$
当 $\mathbf{A}=0$ 时， $\sigma_1=0$ ,所以 $\|\mathbf{A}\|_*=0$

齐次性：
$\|\lambda\mathbf{A}\|_*=\operatorname{tr}\left(\sqrt{\lambda^2\mathbf{A}^T\mathbf{A}}\right)=\left|\lambda\right|\operatorname{tr}\left(\sqrt{\mathbf{A}^T\mathbf{A}}\right)=\left|\lambda\right|\|\mathbf{A}\|_*$

引理
设 $\|\mathbf{x}\|\le1,\|\mathbf{y}\|\le1$
$\mathbf{x}^T\mathbf{Ay}\le\sigma_1$
证明：
$\mathbf{x}^T\mathbf{Ay}\le\|\mathbf{x}\|\|\mathbf{Ay}\|\le\|\mathbf{A}\|=\sigma_1$

三角不等式：
对 $\mathbf{A}$ 进行奇异值分解和精简奇异值分解
$\mathbf{A}=\mathbf{U}\mathbf{\Sigma}\mathbf{V}^T=\mathbf{U}_r\mathbf{\Sigma}_r\mathbf{V}_r^T$
接下来证明 $\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}\right\rangle=\|\mathbf{A}\|_*$
其中 $\left\langle\mathbf{Q},\mathbf{A}\right\rangle=\operatorname{tr}\left(\mathbf{Q}^T\mathbf{A}\right)$

取 $\mathbf{Q}_0=\mathbf{U}_r\mathbf{I}_r\mathbf{V}_r^T=\mathbf{U}_r\mathbf{V}_r^T$
$\begin{aligned} \left\langle\mathbf{Q}_0,\mathbf{A}\right\rangle&=\operatorname{tr}\left(\mathbf{Q}_0^T\mathbf{A}\right)\\ &=\operatorname{tr}\left(\mathbf{V}_r\mathbf{U}_r^T\mathbf{U}_r\mathbf{\Sigma}_r\mathbf{V}_r^T\right)\\ &=\operatorname{tr}\left(\mathbf{V}_r\mathbf{\Sigma}_r\mathbf{V}_r^T\right)\\ &=\operatorname{tr}\left(\mathbf{V}_r^T\mathbf{V}_r\mathbf{\Sigma}_r\right)\\ &=\operatorname{tr}\left(\mathbf{\Sigma}_r\right)\\ &=\|\mathbf{A}\|_* \end{aligned}$
于是
$\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}\right\rangle\ge\|\mathbf{A}\|_*$

$\begin{aligned} \sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}\right\rangle&=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\operatorname{tr}\left(\mathbf{Q}^T\mathbf{A}\right)\\ &=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\operatorname{tr}\left(\mathbf{Q}^T\mathbf{U}\mathbf{\Sigma}\mathbf{V}^T\right)\\ &=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\operatorname{tr}\left(\mathbf{V}^T\mathbf{Q}^T\mathbf{U}\mathbf{\Sigma}\right)\\ &=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\operatorname{tr}\left(\left(\mathbf{U}^T\mathbf{Q}\mathbf{V}\right)^T\mathbf{\Sigma}\right)\\ &=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\sum_{i=1}^{\min\left\{m,n\right\}}\sigma_i\mathbf{u}_i^T\mathbf{Q}\mathbf{v}_i\\ &\le\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\sum_{i=1}^{\min\left\{m,n\right\}}\sigma_i\sigma_1\left({\mathbf{Q}}\right)\\ &\le\sum_{i=1}^{\min\left\{m,n\right\}}\sigma_i\\ &=\|\mathbf{A}\|_{*} \end{aligned}$
于是
$\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}\right\rangle=\|\mathbf{A}\|_*$
所以
$\begin{aligned} \|\mathbf{A}+\mathbf{B}\|_*&=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}+\mathbf{B}\right\rangle\\ &=\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left(\left\langle\mathbf{Q},\mathbf{A}\right\rangle+\left\langle\mathbf{Q},\mathbf{B}\right\rangle\right)\\ &\le \sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{A}\right\rangle+\sup_{\sigma_1\left(\mathbf{Q}\right)\le 1}\left\langle\mathbf{Q},\mathbf{B}\right\rangle\\ &=\|\mathbf{A}\|_*+\|\mathbf{B}\|_* \end{aligned}$