从线性方程组求解到最小二乘问题

最新推荐文章于 2023-08-14 21:19:55 发布

-倾城之恋-

最新推荐文章于 2023-08-14 21:19:55 发布

阅读量1.7k

点赞数

分类专栏：矩阵优化机器学习

本文链接：https://blog.csdn.net/P081513083/article/details/105863224

版权

机器学习同时被 3 个专栏收录

37 篇文章 0 订阅

订阅专栏

优化

12 篇文章 0 订阅

订阅专栏

矩阵

4 篇文章 0 订阅

订阅专栏

关键词：线性方程组，矩阵，秩，矩阵逆，伪逆，左逆，右逆，

线性方程组求解：
$A x = y$
已知 $A\in\R^{m\times n}$ 和 $y\in\R^m$ ，求 $x\in\R^n$ 。
$m$ 为方程个数（行数）， $n$ 为未知数个数（列数），根据 $m$ , $n$ 的大小关系，可以分为3类：
(1) $m > n$ ：超定方程组，
(2) $m = n$ ：适定方程组，
(3) $m < n$ ：欠定（不定）方程组；
三种情况都可能相容（有解）也可能不相容（无解），因此这个关系划分不够本质，最本质的关系应该由秩的概念划分：
(1)相容方程组 $r a n k [A] = r a n k [A, y]$ ，有解。
(2)不相容方程组： $r a n k [A] < r a n k [A, y]$ ，无解。

对于相容方程组：

首先所有的相容方程组都可以由Moore Penrose逆求解：
$x=A^+y+(I-A^+A)c$
其中 $A^+$ 为Moore Penrose $逆， c$ 为 $R^n$ 中任意向量。
其包含三种情况：
(1) $r a n k [A] = n$ , 列满秩：（由于 $rank[A]\leq min(m,n)$ ，暗含 $n\leq m$ ），此时 $A^+A=I$ ，有唯一解：
$x=(A^TA)^{-1}A^Ty$
其中 $A^TA)^{-1}A^T$ 被标记为左逆 $A^{-1}_L$ 。
当 $A$ 的列为单位正交基时， $x=A^Ty$ 。
(2) $r a n k [A] = m$ ，行满秩：（由于 $rank[A]\leq min(m,n)$ ，暗含 $m\leq n$ ），
当 $m = n$ ，与情况(1)相同，有唯一解。
当 $m < n$ ，有无穷解，一特解为 $x=A^T(AA^T)^{-1}y$
其中 $A^T(AA^T)^{-1}$ 被标记为右逆 $A^{-1}_R$ 。
当 $A$ 的行为单位正交基时， $x=A^Ty$ 。（卷积转置可视化原理）。
(3) $r a n k [A] < m i n (m, n)$ , 有无穷解：
$x=A^+y+(I-A^+A)c$
其中 $A^+$ 为Moore Penrose $逆， c$ 为 $R^n$ 中任意向量，解空间维度为 $n - r a n k [A]$ 。

对于无穷解的情况，一般取其极小范数解：
$||x_0||_2=\min\limits_{Ax=y}||x||_2$ ,
$x_0=A^+y。$

对于不相容方程组：

(1)对于不相容方程组，基于最小二乘原则，可以得到最小二乘问题：
$\min\limits_x||Ax-y||_2$
则可以取得最小值的全部解为 $x_0=A^+y+(I-A^+A)c$ ， $c$ 为任意 $R^n$ 。注意当 $A^+A=I$ ,（ $r a n k [A] = n$ ）时，有唯一解取得最小值。

因此不相容方程组的最小二乘解一般不唯一，常取最小二范数解 $x_0=A^+y$ ，称为极小范数最小二乘解。
(2)如果对解加上其他约束，则得到其他形式的解[deep learning. p61]。比如约束 $x^Tx\leq 1$ :
$\min\limits_x\frac{1}{2}||Ax-y||_2^2$
$s.t.~~~x^Tx\leq 1$

(3)最小二乘标准形式(带正则项的最小二乘)[PRML,p144]
$\min\limits_x\frac{1}{2}||Ax-y||_2^2+\frac{\lambda}{2}||x||_2^2$
解析解为 $x_0=(\lambda I+A^TA)^{-1}A^Ty$ 。

Moore Penrose伪逆

最后我们看Moore Penrose伪逆的求法：
(1) [deep learning,p 28]
$A^+=\lim\limits_{\alpha\rightarrow0}(A^TA+\alpha I)^{-1}A^T$
或
$A^+=VD^+U^T$
其中 $U, D, V$ 来自于SVD分解。 $A=UDV^T$ 。
(2)[PRML,p142]
$A^+=(A^TA)^{-1}A^T$
(3)
利用SVD分解[矩阵论简明教程，p142]：
$A^+=VD^+U^T A^+=V \begin{bmatrix} \Sigma^{-1}& 0\\ 0 & 0 \end{bmatrix} U^T$
其中 $A=UDV^T$ 。
或者利用满秩[矩阵论简明教程，p148]：
$A^+=G^T(GG^T)^{-1}(F^TF)^{-1}F^T$
$A=FG,F\in\R_r^{m\times r},G\in\R_{r}^{r\times n}$ 。
列满秩时： $A^+=(A^TA)^{-1}A^T$
行满秩时： $A^+=A^T(AA^T)^{-1}$

https://zhuanlan.zhihu.com/p/91859104

-倾城之恋-

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
从线性方程组求解到最小二乘问题

关键词：线性方程组，矩阵，秩，矩阵逆，伪逆，左逆，右逆，线性方程组求解：Ax=yAx=yAx=y已知A∈Rm×nA\in\R^{m\times n}A∈Rm×n和y∈Rmy\in\R^my∈Rm，求x∈Rnx\in\R^nx∈Rn。mmm为方程个数（行数），nnn为未知数个数（列数），根据mmm,nnn的大小关系，可以分为3类：(1)m>nm>nm>n：超定方程组，(...
复制链接

扫一扫

专栏目录