矩阵求解好例子

不易撞的网名

于 2024-10-08 14:22:09 发布

阅读量603

点赞数 3

分类专栏：机器学习文章标签：矩阵算法机器学习

本文链接：https://blog.csdn.net/weixin_50569789/article/details/142758679

版权

机器学习专栏收录该内容

227 篇文章 5 订阅

订阅专栏

矩阵变换好例子

要将表达式
$\arg\min_{\mathbf{P}} \left( \langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle + \frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2 \right)$
重写为
$\arg\min_{\mathbf{P}} \frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V + \frac{1}{\mu}\mathbf{Y}_1||_F^2,$

可以利用矩阵内积的性质以及范数的定义来完成这个转换。

首先，考虑矩阵内积 $\langle \mathbf{A}, \mathbf{B} \rangle$ 可以被定义为 $\text{trace}(\mathbf{A}^T \mathbf{B})$ 或者等价地 $\sum_{i,j} A_{ij} B_{ij}$ 。对于给定的向量或矩阵 $\mathbf{A}$ ，有以下关系：
$\langle \mathbf{A}, \mathbf{A} \rangle = ||\mathbf{A}||_F^2.$

具体展开原始表达式中的两部分：

矩阵内积项 $\langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle$ 。
范数平方项 $\frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2$ 。

把这两部分组合起来，并且加上一个恒等于零的项 $\frac{1}{2\mu}||\mathbf{Y}_1||_F^2 - \frac{1}{2\mu}||\mathbf{Y}_1||_F^2$ （即加0），这样不会改变原问题的解，但可以帮助重新组织表达式：
$\langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle + \frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2 + \frac{1}{2\mu}||\mathbf{Y}_1||_F^2 - \frac{1}{2\mu}||\mathbf{Y}_1||_F^2.$

接下来，利用范数的性质 $||\mathbf{A}||_F^2 = \langle \mathbf{A}, \mathbf{A} \rangle$ ，我们可以将上述表达式改写为：
$\langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle + \frac{1}{2\mu}||\mathbf{Y}_1||_F^2 + \frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2 - \frac{1}{2\mu}||\mathbf{Y}_1||_F^2.$

然后，利用矩阵内积的线性性质和范数的性质，可以进一步合并前两项：
$\langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle + \frac{1}{2\mu}||\mathbf{Y}_1||_F^2 = \frac{1}{2\mu} \left( 2\mu \langle \mathbf{Y}_1, \mathbf{X} - \mathbf{PH} - \mathbf{E}_V \rangle + ||\mathbf{Y}_1||_F^2 \right).$

由于 $\langle \mathbf{A}, \mathbf{B} \rangle = \langle \mathbf{B}, \mathbf{A} \rangle$ ，上式可以写作：
$\frac{1}{2\mu} \left( ||\mathbf{Y}_1||_F^2 + 2\mu \langle \mathbf{X} - \mathbf{PH} - \mathbf{E}_V, \mathbf{Y}_1 \rangle \right).$

又 $||\mathbf{A} + \mathbf{B}||_{F}^2=||\mathbf{A}||_{F}^2 + 2<A,B> + ||\mathbf{B}||_{F}^2$

因此，根据范数的性质，可以得到:
$\frac{1}{2\mu} \left( ||\mathbf{Y}_1||_F^2 + 2\mu \langle \mathbf{X} - \mathbf{PH} - \mathbf{E}_V, \mathbf{Y}_1 \rangle \right)+\frac{\mu}{2} ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2\\ = \frac{1}{2\mu} \left( ||\mathbf{Y}_1||_F^2 + 2\mu \langle \mathbf{X} - \mathbf{PH} - \mathbf{E}_V, \mathbf{Y}_1 \rangle + \mu^2 ||\mathbf{X} - \mathbf{PH} - \mathbf{E}_V||_F^2 \right)\\ =\frac{1}{2\mu} ||\mathbf{Y}_1 + \mu (\mathbf{X} - \mathbf{PH} - \mathbf{E}_V)||_F^2.$

因此，整个表达式变为：
$\frac{1}{2\mu} ||\mathbf{Y}_1 + \mu (\mathbf{X} - \mathbf{PH} - \mathbf{E}_V)||_F^2 - \frac{1}{2\mu}||\mathbf{Y}_1||_F^2.$

注意到 $\frac{1}{2\mu}||\mathbf{Y}_1||_F^2$ 是与 $\mathbf{P}$ 无关的常数项，所以它不影响优化问题的结果。因此，我们可以忽略这一项，最终得到：
$\frac{1}{2\mu} ||\mathbf{Y}_1 + \mu (\mathbf{X} - \mathbf{PH} - \mathbf{E}_V)||_F^2$

为了简化形式，我们可以提取公共因子 $\frac{\mu}{2}$ ，并利用范数的性质 $\alpha ||\mathbf{A}||_F^2 = ||\sqrt{\alpha} \mathbf{A}||_F^2$ ，从而得到：
$\arg\min_{\mathbf{P}} \frac{\mu}{2} \left( ||\frac{1}{\mu}\mathbf{Y}_1 + (\mathbf{X} - \mathbf{PH} - \mathbf{E}_V)||_F^2 \right).$