证明Ax=0的最小二乘解是ATA的最小特征值对应的特征向量(||x||＝1)

最新推荐文章于 2023-05-04 23:02:16 发布

XDWX

最新推荐文章于 2023-05-04 23:02:16 发布

阅读量1.8k

点赞数 1

分类专栏：数学理论

数学理论专栏收录该内容

111 篇文章 22 订阅

订阅专栏

证明： 当 ||x||＝1时，Ax=0的最小二乘解是 $A^TA$ 的最小特征值对应的特征向量

证：上式等同于证明如下命题： $A^TA$ 的最小特征值所对应的特征向量可使||Ax||最小。
(1) 若x为 $A^TA$ 的特征向量，则
$A^TAx=\lambda x$
可得
$\begin{aligned} ||Ax|| & =(Ax)^T(Ax) \\ &=x^TA^TAx \\ &=x^T\lambda x\\ &=x^Tx\lambda \\ &=\lambda \end{aligned}$

由上式可见，取 $A^TA$ 的最小特征值 $\lambda$ 可使 $∣ ∣ A x ∣ ∣$ 最小。

（2）若 $x$ 不为 $A^TA$ 的特征向量，则可对 $A$ 做SVD分解，得

$\Lambda V^T$

则
$\begin{aligned} ||Ax||&=(Ax)^T(Ax)=x^TA^TAx\\ &=x^TV\Lambda^TU^TU\Lambda V^Tx\\ &=x^TV\Lambda^T\Lambda V^Tx \end{aligned}$

又因为
$\Lambda^T\Lambda=\begin{bmatrix} \lambda_1^2 &&& \\ & \lambda_2^2&&& \\ &&\cdots&&\\ &&&\lambda_n^2&\\ \end{bmatrix}$

且在svd分解中 $V$ 为一组n维的正交基，即
$V=\begin{bmatrix}v_1& v_2& \cdots &v_n\end{bmatrix}$

因此，n维向量x可用该组基来表示：
$\begin{aligned} x&=\alpha_1v_1+\alpha_2v_2+\cdots+\alpha_nv_n &=\begin{bmatrix} v_1 & v_2 &\cdots & v_n \end{bmatrix}\begin{bmatrix} \alpha_1 \\ \alpha_2 \\ \cdots\\ \alpha_n \end{bmatrix} \end{aligned}$

将上述两个式子代入，可得
$\begin{aligned} ||Ax||&=x^TV\Lambda^T\Lambda V^Tx \\ &=\begin{bmatrix} \alpha_1&\alpha_2&\cdots&\alpha_n \end{bmatrix} \begin{bmatrix} v_1\\ v_2\\ \cdots\\ v_n \end{bmatrix} \begin{bmatrix} v_1&v_2&\cdots&v_n \end{bmatrix} \begin{bmatrix} \lambda_1^2 && \\ & \lambda_2^2&& \\ &&\cdots&\\ &&&\lambda_n^2\\ \end{bmatrix}\\ &\begin{bmatrix} v_1\\ v_2\\ \cdots\\ v_n \end{bmatrix} \begin{bmatrix} v_1&v_2&\cdots&v_n \end{bmatrix} \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix}\\ &=\begin{bmatrix} \alpha_1&\alpha_2&\cdots&\alpha_n \end{bmatrix} \begin{bmatrix} \lambda_1^2 && \\ & \lambda_2^2&& \\ &&\cdots&\\ &&&\lambda_n^2\\ \end{bmatrix} \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix}\\ &=\alpha_1^2\lambda_1^2+\alpha_2^2\lambda_2^2+\cdots+\alpha_n^2\lambda_n^2 \end{aligned}$

不是一般性，可令 $\lambda_1\cdots\lambda_N$ 的降序排列，则
$\alpha_1^2\lambda_1^2+\alpha_2^2\lambda_2^2+\cdots+\alpha_n^2\lambda_n^2 \geq \lambda_N^2(\alpha_1^2+\alpha_2^2+\cdots+\alpha_n^2)$