高级优化理论与方法（七）_kaczmarz算法-CSDN博客

本文链接：https://blog.csdn.net/liuzibujian/article/details/137490205

Solving Linear Equations

Case 2

$A\in \mathbb{R}^{m\times n}, m\leq n, rank A=m, x\in \mathbb{R}^n, b\in \mathbb{R}^m$

$\Rightarrow$ infinite many solutions

$\Rightarrow min ||x||$
s.t. $A x = b$

注：在此情形下，由于有无穷多解，可以将 $A x = b$ 看成是优化问题的约束条件，而这个问题可以看成有限子条件的优化问题。

Theorem

Thm: The unique solution $x^*$ of $A x = b$ that minimizes $∣∣ x ∣∣$ is given by $x^*=A^T (AA^T)^{-1}b$ .

Kaczmarz’s Algorithm

为了避免计算逆矩阵，我们介绍Kaczmarz算法。

Set $i=0, x^0$
For $j=1,\cdots, m$ do
$x^{im+j}=x^{im+j-1}+\mu(b_j-{a_j}^Tx^{im+j-1})\frac{a_j}{{a_j}^Ta_j}$
$i$ ++, goto 2

注： $0<\mu<2$ 。由于带限制的优化问题较为复杂，故在本门课程中对带限制的优化问题算法的收敛速度不进行研究。

Theorem

In Kaczmarz’s Algorithm, if $x^0=0$ , then $x^k\to x^*=A^T (AA^T)^{-1}b$ as $k\to \infty$ .

Example

$A=\begin{bmatrix} 1&-1 \\ 0&1 \end{bmatrix}$

$b=\begin{bmatrix} 2 \\ 3 \end{bmatrix}$

$\mu=1, x^0=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$

$a_1=\begin{bmatrix} 1 \\ -1 \end{bmatrix}$

$a_2=\begin{bmatrix} 0 \\ 1 \end{bmatrix}$

$b_1=2, b_2=3$

$x^1=\begin{bmatrix} 0 \\ 0 \end{bmatrix}+\left(2-[1,-1]\cdot \begin{bmatrix} 0 \\ 0 \end{bmatrix}\right)\frac{\begin{bmatrix} 1 \\ -1 \end{bmatrix}}{[1,-1]\cdot \begin{bmatrix} 1 \\ -1 \end{bmatrix}}=\begin{bmatrix} 1 \\ -1 \end{bmatrix}$

$x^2=\begin{bmatrix} 1 \\ -1 \end{bmatrix}+\left(3-[0,-1]\cdot \begin{bmatrix} 1 \\ -1 \end{bmatrix}\right)\frac{\begin{bmatrix} 0 \\ 1 \end{bmatrix}}{[0,1]\cdot \begin{bmatrix} 0 \\ 1 \end{bmatrix}}=\begin{bmatrix} 1 \\ 3 \end{bmatrix}$

$x^3=\begin{bmatrix} 1 \\ 3 \end{bmatrix}+\left(2-[1,-1]\cdot \begin{bmatrix} 1 \\ 3 \end{bmatrix}\right)\frac{\begin{bmatrix} 1 \\ -1 \end{bmatrix}}{[1,-1]\cdot \begin{bmatrix} 1 \\ -1 \end{bmatrix}}=\begin{bmatrix} 3 \\ 1 \end{bmatrix}$

$\cdots$

$x^*=\begin{bmatrix} 5 \\ 3 \end{bmatrix}$

Pseudoinverse

Definition

$A^+\in\mathbb{R}^{m\times n}$ is a pseudoinverse of $A$ , if $AA^TA=A$ and $\exist U\in \mathbb{R}^{n\times n}, V\in \mathbb{R}^{m\times m}$ s.t. $A^+=UA^T, A^+=A^TV$
注：pseudoinverse表示伪逆，是矩阵逆的一种广义形式。

Special Case 1

$m\geq n, rank A=n$

$A^+=(A^TA)^{-1}A^T\rightarrow AA^+A=A$

$U=(A^TA)^{-1}, V=A(A^TA)^{-1}(A^TA)^{-1}A^T$

$A^+=UA^T, A^+=A^TV$

Special Case 2

$m\leq n, rank A=m$

$A^+=A^T(AA^T)^{-1}\rightarrow AA^+A=A$

$U=A^T(AA^T)^{-1}(AA^T)^{-1}A, V=(AA^T)^{-1}$

$A^+=UA^T, A^+=A^TV$

Properties of Pseudoinverse

Lemma 1: Unique pseudoinverse

pf: Assume: $A_1^+, A_2^+$ pseudoinverse of $A$ .
$AA_1^+A=AA_2^+A=A$
And $U_1,U_2\in \mathbb{R}^{n\times n}, V_1,V_2\in \mathbb{R}^{m\times m}$

$A_1^+=U_1A^T=A^TV_1, A_2^+=U_2A^T=A^TV_2$

Let $D=A_2^+-A_1^+, U=U_2-U_1, V=V_2-V_1$

Then $O=ADA, D=UA^T=A^TV$

$\Rightarrow (DA)^TDA=A^TD^TDA=A^TV^TADA=O$

$\Rightarrow DA=O$

$\Rightarrow DD^T=DAU^T=O\Rightarrow D=O$

Lemma 2: Full Rank Factorization

Let $A\in \mathbb{R}^{m\times n}, rank A=r\leq min(m,n)$ . Then exist $B\in\mathbb{R}^{m\times r}$ and $C\in\mathbb{R}^{r\times n}$ , with $r ank B = r ank C = r$ and $A = BC$ .

Lemma 3

Let $A\in \mathbb{R}^{m\times n}$ have full rank factorization $A = BC$ , Then $A^+=C^+B^+$ .

Example

$A=\begin{bmatrix} 2&1&-2&5 \\ 1&0&-3&2\\ 3&-1&-13&5 \end{bmatrix}$

$r ank A = 2$

$B=\begin{bmatrix} 2&1 \\ 1&0 \\ 3&-1 \end{bmatrix}$

$C=\begin{bmatrix} 0&1&-3&2 \\ 1&0&4&1 \end{bmatrix}$

$A=BC, A^+=C^+B^+$

Case 3

$A\subseteq \mathbb{R}^{m\times n}, rankA\leq min(m,n)$

① $x$ minimize $Ax-b||^2$

② $x$ minimize $∣∣ x ∣∣$

注：Case 1和Case 2的主要区别在于 $m$ 和 $n$ 的大小关系，此时 $A$ 满秩。Case 3则表示了 $A$ 不满秩的更为一般的情形。在 $m = n$ 时，Case 1和Case 2两种情况均适用。在 $A$ 满秩的时候，Case 3也适用。故在分类条件中，并没有严格分类讨论，而是把该结论适用的最大范围写了上去。

Theorem

Given $A x = b$ with $r ank A = r$ , the unique vector $x^*=A^+b$ minimizes $Ax-b||^2$ . Furthermore, among all vectors that minimize $Ax-b||^2$ , $x^*$ is the unique one with minimal norm.