假设实验前我们测定一个线性的关系,测量有三组数据,(1,1)、(2,2)、(3,3),认为它们在直线y=Cx+D上,所以将三个点坐标代入直线,得到:
![f11947d6760fafc1de0fbc65e8ae4873.png](https://img-blog.csdnimg.cn/img_convert/f11947d6760fafc1de0fbc65e8ae4873.png)
我们要求这个方程组Ax=b,因为实际上这三个点并不在一条直线上即b不在A的列空间中,所以这个方程组无解。
所以去求最优解,将b投影到A的列空间中。
![d45310d93a709ee043a19d4de22d05c1.png](https://img-blog.csdnimg.cn/img_convert/d45310d93a709ee043a19d4de22d05c1.png)
此时p在A的列空间中,p与b之间隔着误差|e|=|Ax-b|,我们保证误差最小化即得到最优解
![40110b5a1b30c0dcb78ca91c3dc2360d.png](https://img-blog.csdnimg.cn/img_convert/40110b5a1b30c0dcb78ca91c3dc2360d.png)
如果从微积分角度去求解这个问题,就是关于f(C,D)的二元函数的极小值问题,分别去对C和D求偏导数令其为0,最后会得到一个关于C和D的二元一次方程组,而这个方程组就是我们需要的
![9804b32d8d0b4660ffedba858584407e.png](https://img-blog.csdnimg.cn/img_convert/9804b32d8d0b4660ffedba858584407e.png)
现在我们直接从这个公式出发
![af9b9aaa3f70a6421e0b5c36dd0b4da9.png](https://img-blog.csdnimg.cn/img_convert/af9b9aaa3f70a6421e0b5c36dd0b4da9.png)
再把b加进来做增广矩阵一起计算,就可以得到上面公式的结果
![66c5b5861255f970e6cf0d19960a3ab3.png](https://img-blog.csdnimg.cn/img_convert/66c5b5861255f970e6cf0d19960a3ab3.png)
化为正规的方程组
![44a69d17822bf9e2df7490c93bd3e975.png](https://img-blog.csdnimg.cn/img_convert/44a69d17822bf9e2df7490c93bd3e975.png)
解得C=1/2,D=2/3,所以这里的直线是y=1/2x+2/3
![6f55ca815963030f606f588061ae3317.png](https://img-blog.csdnimg.cn/img_convert/6f55ca815963030f606f588061ae3317.png)
这就是最小二乘法求线性回归方程的思想,利用最重要的公式做线性回归分析
这说明了对于一个矩阵A而言,它可能并不一定是一个好的矩阵,但是A^T·A是一个对称的方阵,这是一个好的矩阵,我们用好的矩阵替换原先的矩阵,就可以使得一个无解的方程变得有解,这个解是原方程的最优解。