本文讲解线性回归与线性最小二乘问题的正规方程(normal equations),矩阵条件数(condition number),以及用Cholesky分解和QR分解来解正规方程的步骤。
1. 线性回归(linear regression) & 最小二乘问题 (least squares problem)
考虑这样一个问题:给定
为方便表示,记权重向量
假如所有样本点都满足(1)式(即这个超平面经过所有的样本点),则我们求解如下的线性系统即可得到权重向量:
记
然而,一般来说
用矩阵和向量表示即
<多项式拟合问题(Polynomial data fitting)>
给定
记为
2. 正规方程 (normal equations) & 伪逆
解最小二乘问题
注意上式中所有项均为标量,故
假设
对
(2)式称为最小二乘问题的正规方程(normal equations)。由(2)式:
定义矩阵
则有
3. Cholesky分解解正规方程
可以对矩阵
1) 计算
2) 对
3) 解下三角系统
4) 解上三角系统
4. 矩阵的条件数(condition number)
记线性系统为
<4.1 可逆矩阵的条件数>
当
选择向量范数和相应的矩阵范数,左右两边取范数得
又
定义矩阵
上式表明,线性系统解的相对误差由residual和条件数约束。
由于
<4.2 正交矩阵的条件数>
设
根据矩阵范数的定义,
(或直接由
同理,
乘正交矩阵不会放大误差,这是其非常好的性质。
<4.3 对称正定矩阵的条件数>
若
即对称正定阵的
<4.4 当A不可逆时>
若
和前面的过程类似,可以得到
设
而直接解正规方程
上式说明由直接解正规方程得到的解的相对误差由
5. 最小二乘问题的QR分解(full size & economy size)
<5.1 Full size QR decomposition>
记
其中
则对最小二乘问题
(左乘正交矩阵
所以
注意现在我们求解的是上三角系统
<5.2 Economy size QR decomposition>
Economy size的QR分解为:
所以只需解上三角系统
综上,将线性最小二乘问题正规方程的QR分解法步骤表述如下(参考文献[1], Chapter 6, page 156):
1) QR分解
full size:
economy size:
2) full size:
3) 解上三角系统
参考文献
[1] Uri M. Ascher, Chen Greif. A First Course in Numerical Methods, SIAM, 2011. (Chapter 5, 6)