5.2 最优近似解 x ^ = A L − 1 b \mathbf{\hat{x}} = A^{-1}_L\mathbf{b} x^=AL−1b 是最小二乘解
根据平面几何定理,点到直线的距离,垂线最短,推广到高维,即点到子空间的距离,垂线最短。根据投影性质,向量 b p \mathbf{b}_p bp 是向量 b \mathbf{b} b 在子空间 c o l A col A colA 的垂足,向量 b − b p \mathbf{b}-\mathbf{b}_p b−bp 是垂线,距离最短,又 b p = A x ^ \mathbf{b}_p = A\mathbf{\hat{x}} bp=Ax^ ,得
∥ b − b p ∥ = ∥ b − A x ^ ∥ = m i n x ( ∥ b − A x ∥ ) \| \mathbf{b}-\mathbf{b}_p \| = \| \mathbf{b}-A\mathbf{\hat{x}} \| = min_\mathbf{x} (\| \mathbf{b}-A\mathbf{x} \|) ∥b−bp∥=∥b−Ax^∥=minx(∥b−Ax∥)
在子空间 c o l A col A colA 中任意向量 A x A\mathbf{x} Ax 与向量 b \mathbf{b} b 的距离大于垂线距离 ∥ b − b p ∥ \| \mathbf{b}-\mathbf{b}_p \| ∥b−bp∥ ,距离 ∥ b − A x ∥ \| \mathbf{b}-A\mathbf{x} \| ∥b−Ax∥ 最小的解即是最优近似解。
∥ b − b p ∥ 2 \| \mathbf{b}-\mathbf{b}_p \|^2 ∥b−bp∥2 是什么呢? ∥ b − b p ∥ 2 = ∥ b − A x ^ ∥ 2 = ∑ i ( b i − a r i T x ^ ) 2 \| \mathbf{b}-\mathbf{b}_p \|^2 = \| \mathbf{b}-A\mathbf{\hat{x}} \|^2 = \sum_i (b_i-\mathbf{a}^T_{ri}\mathbf{\hat{x}})^2 ∥b−bp∥2=∥b−Ax^∥2=∑i(bi−ariTx^)2 。 b i − a r i T x ^ b_i-\mathbf{a}^T_{ri}\mathbf{\hat{x}} bi−ariTx^ 是第 i i i 次测量数据的预测值 b ^ i = a r i T x ^ \hat{b}_i=\mathbf{a}^T_{ri}\mathbf{\hat{x}} b^i=ariTx^ 与实际测量值 b i b_i bi 的差, b i − b ^ i b_i-\hat{b}_i bi−b^i 称为残差。最优近似解的残差平方和最小,故称最小二乘解,二乘就是指平方和。