最小二范数解

最新推荐文章于 2023-08-24 12:59:21 发布

Mr.Bulijiojiodibulido

最新推荐文章于 2023-08-24 12:59:21 发布

阅读量1.1w

点赞数 12

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_43490741/article/details/104555313

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最小二范数解

子空间投影问题(最小二乘法)

投影向量

$\textbf{b}$ 向 $z$ 轴和 $x y$ 平面投影分别为 $\textbf{p}_{1}$ 和 $\textbf{p}_{2}$ 两个变换矩阵 $\textbf{P}_{1}$ 和 $\textbf{P}_{2}$ 满足如下以上的例子中两个子空间是正交补的。
上面的问题可以描述为，在空间 $\mathbb{R}^{n}$ 中，寻找向量 $\textbf{b}$ 向子空间 $\mathbb{R}^{m}$ 投影的变换矩阵 $\textbf{P}$ 。

考虑如下情况向量到直线上投影

在二维空间上 $\mathbb{R}^{2}$ ,求 $\textbf{b}$ 在子空间 $\textbf{A}=[1 \ 0]^{T}$ 上的投影 $\textbf{p}$ 。
$\figure\向量向直线投影.jpg$

投影方法
$\textbf{p}$ 可以表示为 $\textbf{p}=\textbf{A}\textbf{x},\textbf{x}\in \mathbb{R}^{1}$
$\vec{bp}=\textbf{p}-\textbf{b}=\textbf{b}-\textbf{A}\textbf{x}$
由于 $\textbf{b}-\textbf{A}\textbf{x}\perp\textbf{A}$
所以 $\textbf{A}^{T}(\textbf{b}-\textbf{A}\textbf{x})=0$
$\textbf{A}^{T}\textbf{A}\textbf{x}=\textbf{A}^{T}\textbf{b}$
$\textbf{x}=(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$ ，那么最终得到
$\textbf{p}=\textbf{A}(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$
优化方法（最小二乘法）
$\textbf{p}$ 可以表示为 $\textbf{p}=\textbf{A}\textbf{x},\textbf{x}\in \mathbb{R}^{1}$ \优化的过程可以表示为 $\min\limits_{\textbf{x}}J(\textbf{x})=\left\|\vec{bp}\right\|_2^2$ 其中 $J(\textbf{x})=(\textbf{b}-\textbf{A}\textbf{x})^{T}(\textbf{b}-\textbf{A}\textbf{x})$ \那么 $J'(\textbf{x})=\textbf{A}^{T}(\textbf{b}-\textbf{A}\textbf{x})=0$ 得到（具体参见标量函数对矢量/矩阵的导数内容） $\textbf{p}=\textbf{A}(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$

子空间投影

之前的叙述中 $\textbf{x}$ 可以理解为将投影子空间的基线性组合为 $\textbf{p}$ 的系数，进行如下的叙述：\假设，在空间 $\mathbb{R}^{m}$ 中的 $n$ 个向量 $\textbf{a}_1,\textbf{a}_2,\cdots,\vec{a_n}$ 是线性不相关的，我们想找到一个线性组合 $\textbf{p}=\hat{x}_1\textbf{a}_1+\cdots+\hat{x}_n\textbf{a}_n$ 使得 $\min\limits_{\textbf{x}}J(\textbf{x})=\left\|\vec{bp}\right\|_2^2$ ，那么只要 $\vec{bp}$ 垂直于子空间便满足要求，也即 $\vec{bp}$ 垂直于子空间所有向量，得到如下等式：
$\begin{matrix} a_1^T(\textbf{b}-\textbf{A}\textbf{x})=0 \\ \vdots \\ a_n^T(\textbf{b}-\textbf{A}\textbf{x})=0 \\\end{matrix}\quad or\quad\left[ \begin{matrix} a_1^T \\ \vdots \\ a_n^T \\ \end{matrix}\right]\left[\textbf{b}-\textbf{A}\textbf{x}\right]=\textbf{A}^T(\textbf{b}-\textbf{A}\textbf{x})=\textbf{0}$
化简
$\textbf{x}=(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$
$\textbf{p}=\textbf{A}(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$

最小二范数解

对于之前讨论的问题 $\min\limits_{\textbf{x}}J(\textbf{x})=\left\|\textbf{b}-\textbf{A}\textbf{x}\right\|_2^2$

$\textbf{A}\in\mathbb{R}^{m\times n},\textbf{x}\in\mathbb{R}^{n\times 1},\textbf{b}\in\mathbb{R}^{m\times 1}$
$\textbf{A}$ 行满秩或列满秩

设任意一向量 $\textbf{vect}=\textbf{b}-\textbf{A}\textbf{x}$ ，移项后具有 $\textbf{A}\textbf{x}=\textbf{b}$ 的形式，那么对于 $\textbf{A}\textbf{x}=\textbf{b}$ 我们知道：

$m = n$ 时，方程具有唯一解
$m > n$ 时，方程无解
$m < n$ 时，方程有无穷解
在之前投影的问题 $\vec{bp}=\textbf{b}-\textbf{A}\textbf{x}$ ( $\textbf{b}\notin\textbf{A}$ )属于方程无解的情况，得到的解 $\textbf{x}$ 为使 $\left\|\textbf{b}-\textbf{A}\textbf{x}\right\|_2^2$ （或者叫做误差）最小的解。但对于 $m < n$ ，方程有无穷解的情况可以利用最小二乘法求解最小二范数解。
$\textbf{A}\textbf{x}=\textbf{b}$ ，满足：

$\textbf{A}\in\mathbb{R}^{m\times n},\textbf{x}\in\mathbb{R}^{n\times 1},\textbf{b}\in\mathbb{R}^{m\times 1}$
$\textbf{A}$ 行满秩
$m < n$

问题描述 $\min\limits_{\textbf{x}}\left\|\textbf{x}\right\|_2^2=\textbf{x}^T\textbf{x}$ ( $s.t.\textbf{A}\textbf{x}=\textbf{b}$ )
引入拉格朗日算子 $J(\textbf{x})=\frac{1}{2}\textbf{x}^T\textbf{x}-\lambda(\textbf{A}\textbf{x}-\textbf{b}),(\lambda\in\mathbb{R}^{m\times 1})$
对上式求导 $\nabla J(\textbf{x})=\textbf{x}-\textbf{A}^T\lambda=0$
$\textbf{x}=\textbf{A}^T\lambda$
$\textbf{A}\textbf{x}=\textbf{A}\textbf{A}^T\lambda$
$(\textbf{A}\textbf{A}^T)^{-1}\textbf{A}\textbf{x}=\lambda$
$\lambda=(\textbf{A}\textbf{A}^T)^{-1}\textbf{b}$
可以得到
$\textbf{x}=\textbf{A}^T(\textbf{A}\textbf{A}^T)^{-1}\textbf{b}$
结论，对 $\textbf{A}\textbf{x}=\textbf{b}$ ：

$m = n$ 时，方程具有唯一解- $m > n$ 时，方程无解最小二乘解为 $\textbf{x}=(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}\textbf{b}$
$m < n$ 时，方程有无穷解
最小二范数解为 $\textbf{x}=\textbf{A}^T(\textbf{A}\textbf{A}^T)^{-1}\textbf{b}$ 其中 $(\textbf{A}^{T}\textbf{A})^{-1}\textbf{A}^{T}$ 和 $\textbf{A}^T(\textbf{A}\textbf{A}^T)^{-1}$ 为 $\textbf{A}$ 在相应情况下的伪逆矩阵。

Mr.Bulijiojiodibulido

关注

12
点赞
踩
53

收藏

觉得还不错? 一键收藏
3
评论
最小二范数解

最小二范数解子空间投影问题(最小二乘法)投影向量b\textbf{b}b向zzz轴和xyxyxy平面投影分别为p1\textbf{p}_{1}p1和p2\textbf{p}_{2}p2两个变换矩阵P1\textbf{P}_{1}P1 和 P2\textbf{P}_{2}P2满足如下以上的例子中两个子空间是正交补的。上面的问题可以描述为，在空间Rn\mathbb{R}^{n}Rn中，...
复制链接

扫一扫