【最小二乘法】矩阵法解法及Python代码

当线性方程组无解时,如何寻求一个最精确解,以贴合在坐标系中离散的坐标点。
给出三个笛卡尔坐标系下的坐标点:
( 1 , 0 )( 2 , 0 )( 1 , 2 ) (1,0)(2,0)(1,2) 1,0)(2,0)(1,2
找到一条直线 y = k x + b y=kx+b y=kx+b,能够贴合这三点(显然不可能)。为表述方便,以 x 1 x₁ x1 k k k x 2 x₂ x2 b b b
得到以下方程组:
{ 1 × k + b = 0 2 × k + b = 0 1 × k + b = 2 ⇔ { 1 × x 1 + x 2 = 0 2 × x 1 + x 2 = 0 1 × x 1 + x 2 = 2 \left\{ \begin{array}{c} 1×k+b=0 \\ 2×k+b=0 \\ 1×k+b=2 \end{array} \right. ⇔ \left\{ \begin{array}{c} 1×x_1+x_2=0 \\ 2×x_1+x_2=0 \\ 1×x_1+x_2=2 \end{array} \right. 1×k+b=02×k+b=01×k+b=2 1×x1+x2=02×x1+x2=01×x1+x2=2
将线性方程组写成矩阵形式:
A = [ 1 1 2 1 1 1 ]   b = [ 0 0 2 ] \begin{gathered} A= \begin{bmatrix} 1&1 \\ 2&1 \\ 1&1 \end{bmatrix} \end{gathered} \begin{gathered}   b= \begin{bmatrix} 0 \\ 0 \\ 2 \end{bmatrix} \end{gathered} A= 121111 b= 002
得出矩阵符合关系式: A x = b Ax=b Ax=b,而我们的目的则是求得一个原始列向量:
x = [ x 1 x 2 ] \begin{gathered} x= \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} \end{gathered} x=[x1x2]

分析线性方程组解的情况

(1)

根据矩阵 A = [ 1 1 2 1 1 1 ] \begin{gathered} A= \begin{bmatrix} 1&1 \\ 2&1 \\ 1&1 \end{bmatrix} \end{gathered} A= 121111 列向量线性无关,可得 m = 3 , n = 2 , r = 2 m=3,n=2,r=2 m=3,n=2,r=2
r < m , 且 n = r r<m,且n=r r<m,n=r可知:线性方程组无解,或存在唯一解。

(2)

由于向量b= [ 0 0 2 ] \begin{gathered} \begin{bmatrix} 0 \\ 0 \\ 2 \end{bmatrix} \end{gathered} 002 ,无法由 A = [ 1 1 2 1 1 1 ] \begin{gathered} A= \begin{bmatrix} 1&1 \\ 2&1 \\ 1&1 \end{bmatrix} \end{gathered} A= 121111 线性组合得到,即向量b不在列空间C(A)上。

综上所述可知,线性方程组无解,准确来说,无精确解。

寻找近似解

由线性方程组 A x = b ,即可以得到矩阵 Ax=b,即可以得到矩阵 Ax=b,即可以得到矩阵 A = [ 1 1 2 1 1 1 ] \begin{gathered} A= \begin{bmatrix} 1&1 \\ 2&1 \\ 1&1 \end{bmatrix} \end{gathered} A= 121111 的两个线性无关向量:
a 1 = [ 1 2 1 ] a 2 = [ 1 1 1 ] \begin{gathered} a_1= \begin{bmatrix} 1 \\ 2\\1 \end{bmatrix} \end{gathered} \begin{gathered} a_2= \begin{bmatrix} 1 \\ 1\\1 \end{bmatrix} \end{gathered} a1= 121 a2= 111
这两个向量张成 R 3 R^3 R3空间中的一个二维空间,即矩阵A的列空间 C ( A ) C(A) CA。由于向量 b = [ 0 0 2 ] \begin{gathered} b= \begin{bmatrix} 0 \\ 0 \\ 2 \end{bmatrix} \end{gathered} b= 002 在列空间 C ( A ) C(A) CA外,因此线性方程组 A x = b Ax=b Ax=b是无解的。
p=Pb:P为投影向量,对应着将向量b投影到列空间C(A)的操作。

虽然线性方程组 A x = b Ax=b Ax=b不存在精确解,但我们可以寻求距离目标最近的近似解。根据上图,我们可以直观的思考到一个合理的方法——从向量 b b b向二维空间即列空间 C ( A ) C(A) C(A)上引垂线,得到 b b b的投影向量 p p p。由 p p p b b b可得误差向量 e = b − p e=b-p e=bp
向量 b b b经“某一矩阵”变换后,可得位于列空间 C ( A ) C(A) C(A)上的投影向量 p p p。而“某一矩阵”则称为“投影矩阵”。我们可以得到关系式:
p = P b p=Pb p=Pb
引出投影向量 p p p后,问题就清晰了,我们可以求出 p p p向量来近似求解方程 A x ^ = p A\hat{x}=p Ax^=p对应 x = [ x 1 x 2 ] \begin{gathered} x= \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} \end{gathered} x=[x1x2]

求解的思路与步骤

由上图可知 p p p向量的两个性质:
(1)
p p p向量位于列空间 C ( A ) C(A) CA上,即 A x ^ = p A\hat{x}=p Ax^=p
A x ^ = [ a 1 a 2 ] [ x 1 ^ x 2 ^ ] = p A\hat{x}=\begin{gathered} \begin{bmatrix} a_1&a_2\end{bmatrix} \end{gathered}\begin{gathered} \begin{bmatrix} \hat{x_1} \\ \hat{x_2} \end{bmatrix} \end{gathered}=p Ax^=[a1a2][x1^x2^]=p
(2)
误差向量垂直于二维空间 C ( A ) C(A) C(A)的任一组向量。
a 1 ・ e = 0 和 a 2 ・ e = 0 a_1・e=0和a_2・e=0 a1e=0a2e=0
{ e = b − p p = A x ^ \left\{ \begin{array}{c} e=b-p \\ p=A\hat{x} \end{array} \right. {e=bpp=Ax^代入上述等式:
{ a 1 e = a 1 ( b − p ) = a 1 ( b − A x ^ ) = 0 a 2 e = a 2 ( b − p ) = a 2 ( b − A x ^ ) = 0 \left \{ \begin{array}{c} a_1e=a_1(b-p)=a_1(b-A\hat{x})=0 \\ a_2e=a_2(b-p)=a_2(b-A\hat{x})=0 \end{array} \right. {a1e=a1(bp)=a1(bAx^)=0a2e=a2(bp)=a2(bAx^)=0

将向量内积转化为矩阵乘法

{ a 1 T ( b − A x ^ ) = 0 a 2 T ( b − A x ^ ) = 0 \left \{ \begin{array}{c} a^T_1(b-A\hat{x})=0 \\ a^T_2(b-A\hat{x})=0 \end{array} \right. {a1T(bAx^)=0a2T(bAx^)=0
整理得:
[ a 1 T a 2 T ] ( b − A x ^ ) = 0 \begin{gathered} \begin{bmatrix} a^T_1 \\ a^T_2 \end{bmatrix}(b-A\hat{x})=0 \end{gathered} [a1Ta2T](bAx^)=0
A = [ a 1 a 2 ] 则 [ a 1 T a 2 T ] = A T ⇒ \begin{gathered} A=\begin{bmatrix} a_1 & a_2 \end{bmatrix} \end{gathered}则\begin{gathered} \begin{bmatrix} a^T_1 \\ a^T_2 \end{bmatrix}=A^T \end{gathered}⇒ A=[a1a2][a1Ta2T]=AT
x ^ = ( A T A ) − 1 A T b \hat{x}=(A^TA)^{-1}A^Tb x^=(ATA)1ATb
将上式代入 p = A x ^ p=A\hat{x} p=Ax^,得:
p = A ・ ( A T A ) − 1 A T b p=A・(A^TA)^{-1}A^Tb p=A(ATA)1ATb
代入 p = P b p=Pb p=Pb,得:
P = A ・ ( A T A ) − 1 A P=A・(A^TA)^{-1}A P=A(ATA)1A
公式汇总:
{ x ^ = ( A T A ) − 1 A T b p = A ・ ( A T A ) − 1 A T b P = A ・ ( A T A ) − 1 A \left\{ \begin{array}{c} \hat{x}=(A^TA)^{-1}A^Tb \\ p=A・(A^TA)^{-1}A^Tb \\ P=A・(A^TA)^{-1}A \end{array} \right. x^=(ATA)1ATbp=A(ATA)1ATbP=A(ATA)1A

结论

最小二乘法的几何意义是高维空间中的一个向量在低维空间上的投影。

Python代码求解

代码

import numpy as np
from scipy import linalg
A=np.array([[1,1],
            [2,1],
            [1,1]])
b=np.array([0,0,2])
A_T_A=np.dot(A.T,A)
A_T_A_in=linalg.inv(A_T_A)
x_hat=np.dot(np.dot(A_T_A_in,A.T),b)
p=np.dot(A,x_hat)
p_matrix=np.dot(A,np.dot(A_T_A_in,A.T))
print("近似解x为:")
print(x_hat)
print("\n投影向量p为:")
print(p)
print("\n投影矩阵P为:")
print(p_matrix)

运行结果

近似解x为:
[-1.  2.]    

投影向量p为:
[1. 0. 1.]   

投影矩阵P为:
[[0.5 0.  0.5]
 [0.  1.  0. ]
 [0.5 0.  0.5]]
  • 7
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值