MIT线性代数笔记-第16讲-投影矩阵，最小二乘

寒蜩

已于 2023-12-29 22:25:32 修改

阅读量1.1k

点赞数 23

分类专栏：线性代数文章标签：线性代数 MIT

于 2023-11-28 13:05:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiaoliao946/article/details/134664866

版权

线性代数专栏收录该内容

35 篇文章 4 订阅

订阅专栏

目录

16.投影矩阵，最小二乘
- 打赏

16.投影矩阵，最小二乘

证明两个极端情况

证明当 $\vec{b}$ 在 $A$ 的列空间里时，它的投影为它本身：

设 $\vec{b} = A \vec{x}$ ，则 $\vec{b} = A (A^T A)^{-1} A^T A \vec{x} = A \vec{x} = \vec{b}$

证明当 $\vec{b}$ 与 $A$ 的列空间正交时，它的投影为 $\vec{0}$ ：

因为 $\vec{b}$ 与 $A$ 的每一列都正交，所以 $A^{T} \vec{b} = \vec{0}$ ，所以 $\vec{b} = A (A^{T} A)^{-1} A^{T} \vec{b} = \vec{0}$
当使用 $P$ 将 $\vec{b}$ 投影到某个空间中得到 $\vec{p}$ 时， $\vec{b}$ 分解出的另一个向量 $\vec{e}$ 即为 $\vec{b}$ 在该空间的任意正交补中的投影，此时那个正交补的投影矩阵即为 $I - P$ ，由此可以得到两个互为正交补的空间的投影矩阵之和为 $I$
最小二乘法

点为 $(x_{1} , y_{1}) , \cdots , (x_{n} , y_{n})$ ，设拟合直线为 $\widehat{y} = \widehat{b} x + \widehat{a}$

有 $\begin{bmatrix} x_{1} & 1 \\ \vdots & \vdots \\ x_{n} & 1 \end{bmatrix} , \widehat{\vec{x}} = \begin{bmatrix} \widehat{b} \\ \widehat{a} \end{bmatrix} , \vec{b} = \begin{bmatrix} y_{1} \\ \vdots \\ y_{n} \end{bmatrix}$

要使总误差最小，需要在 $A$ 的列空间中找到一个 $\vec{b}^{'}$ 使得 $|\vec{b} - \vec{b}^{'}|$ 最小（也就是使 $(y_1 - \widehat{y_1})^2 + \cdots + (y_{n} - \widehat{y_n})^2$ 最小）

证明 $\vec{b}^{'} = \vec{p}$ 时误差最小：

此时误差为 $|\vec{e}|$

若选取除 $\vec{p}$ 以外的 $A$ 的列空间中的向量，设其为 $\vec{b}^{'} = \vec{p} + \vec{a}$ ，那么 $\vec{b} - \vec{b}^{'} = \vec{e} - \vec{a}$

已知 $\vec{e}$ 垂直于 $A$ 的列空间中的任意向量，又 $\vec{a}$ 属于 $A$ 的列空间，所以 $\vec{e}$ 与 $\vec{a}$ 垂直

因而 $|\vec{e} - \vec{a}|^2 = \vec{e}^2 + \vec{a}^2 > \vec{e}^2$ ，即 $|\vec{e} - \vec{a}| > |\vec{e}|$

所以选取除 $\vec{p}$ 以外的 $A$ 的列空间中的向量都会导致误差增大

有 $\vec{p} = (\widehat{y_1} , \cdots , \widehat{y_n}) , \vec{e} = (y_1 - \widehat{y_1} , \cdots , y_n - \widehat{y_n})$

推导最小二乘法的公式：

法一： $\because P = A (A^T A)^{-1} A^T$

$\begin{aligned} \therefore \vec{p} & = \begin{bmatrix} x_1 & 1 \\ \vdots & \vdots \\ x_n & 1 \end{bmatrix} (\begin{bmatrix} x_1 & \cdots & x_n \\ 1 & \cdots & 1 \end{bmatrix} \begin{bmatrix} x_1 & 1 \\ \vdots & \vdots \\ x_n & 1 \end{bmatrix})^{-1} \begin{bmatrix} x_1 & \cdots & x_n \\ 1 & \cdots & 1 \end{bmatrix} \begin{bmatrix} y_1 \\ \vdots \\ y_n \end{bmatrix} \\ & = \begin{bmatrix} x_1 & 1 \\ \vdots & \vdots \\ x_n & 1 \end{bmatrix} \begin{bmatrix} \sum{x_i^2} & n \overline{x} \\ n \overline{x} & n \end{bmatrix}^{-1} \begin{bmatrix} \sum{x_i y_i} \\ n \overline{y} \end{bmatrix} \\ & = \begin{bmatrix} x_1 & 1 \\ \vdots & \vdots \\ x_n & 1 \end{bmatrix} \begin{bmatrix} \dfrac{1}{t} & \dfrac{-n \overline{x}}{nt} \\ \dfrac{-\overline{x}}{t} & \dfrac{\sum{x_i^2}}{nt} \end{bmatrix} \begin{bmatrix} \sum{x_i y_i} \\ n \overline{y} \end{bmatrix} \\ & = \begin{bmatrix} \dfrac{n (x_1 - \overline{x})}{nt} & \dfrac{\sum{x_i^2} - n \overline{x} x_1}{nt} \\ \vdots & \vdots \\ \dfrac{n (x_n - \overline{x})}{nt} & \dfrac{\sum{x_i^2} - n \overline{x} x_n}{nt} \end{bmatrix} \begin{bmatrix} \sum{x_i y_i} \\ n \overline{y} \end{bmatrix} \\ & = \begin{bmatrix} \dfrac{1}{t} (\sum{x_i y_i} (x_1 - \overline{x}) + \overline{y} (\sum{x_i^2} - n \overline{x} x_1)) \\ \vdots \\ \dfrac{1}{t} (\sum{x_i y_i} (x_{n} - \overline{x}) + \overline{y} (\sum{x_i^2} - n \overline{x} x_n)) \end{bmatrix} \end{aligned}$

其中， $\sum{x_i^2 - n \overline{x}^2}$

代入 $x_1 , y_1) , (x_2 , y_2)$ 得：

$\left\{\begin{matrix} \widehat{b} x_1 + a = \dfrac{1}{t} (\sum{x_i y_i} (x_1 - \overline{x}) + \overline{y} (\sum{x_i^2} - n \overline{x} x_1) \\ \widehat{b} x_2 +a = \dfrac{1}{t} (\sum{x_i y_i} (x_2 - \overline{x}) + \overline{y} (\sum{x_i^2} - n \overline{x} x_2)) \end{matrix}\right.$

解得： $\left\{\begin{matrix} \widehat{b} = \dfrac{1}{t} (\sum{x_i y_i} - n \overline{x} \overline{y}) = \dfrac{\sum{x_i y_i} - n \overline{x} \overline{y}}{\sum x_i^2 - n \overline{x}^2} \\ \widehat{a} = \overline{y} - \widehat{b} \overline{x} \end{matrix}\right.$

法二： 求拟合直线时，由上一讲可得 $A^T \vec{b} = A^T A \vec{x}$

可以考虑这么计算： $A^T \begin{bmatrix} A | \vec{b} \end{bmatrix} = \begin{bmatrix} A^T A | A^T \vec{b} \end{bmatrix}$ ，再使用 $A^T \vec{b} = A^T A \vec{x}$ 列出方程组得到 $\vec{x}$

有 $A^T \vec{b} = \begin{bmatrix} \sum{x_{i} y_{i}} \\ n \overline{y} \end{bmatrix} , A^T A = \begin{bmatrix} \sum x_i^2 & n \overline{x} \\ n \overline{x} & n \end{bmatrix}$

所以可以列出的方程组为： $\left\{\begin{matrix} \sum x_i^2 \widehat{b} + n \overline{x} \widehat{a} = \sum{x_i y_i} \\ n \overline{x} \widehat{b} + n \widehat{a} = n \overline{y} \end{matrix}\right.$ ，解得： $\left\{\begin{matrix} \widehat{b} = \dfrac{\sum{x_i y_i} - n \overline{x} \overline{y}}{\sum x_i^2 - n \overline{x}^2} \\ \widehat{a} = \overline{y} - \widehat{b} \overline{x} \end{matrix}\right.$

例：求 $(1, 1), (2, 2), (3, 2)$ 三点的一条拟合直线

设直线为 $\widehat{y} = \widehat{b} x + \widehat{a}$

有 $\left\{\begin{matrix} \widehat{b} + \widehat{a} = 1 \\ 2\widehat{b} + \widehat{a} = 2 \\ 3\widehat{b} + \widehat{a} = 2 \end{matrix}\right.$ ，即 $\begin{matrix} \begin{bmatrix} 1 & 1 \\ 2 & 1 \\ 3 & 1 \end{bmatrix} & \begin{bmatrix} \widehat{b} \\ \widehat{a} \end{bmatrix} & = & \begin{bmatrix} 1 \\ 2 \\ 2 \end{bmatrix} \\ A & \widehat{\vec{x}} & & \vec{b} \end{matrix}$

易得 $\vec{b}$ 不属于 $A$ 的列空间

由 $\begin{matrix} \begin{bmatrix} 1 & 2 & 3 \\ 1 & 1 & 1 \end{bmatrix} & \begin{bmatrix} 1 & 1 & | & 1 \\ 2 & 1 & | & 2 \\ 3 & 1 & | & 2 \end{bmatrix} & = & \begin{bmatrix} 14 & 6 & | & 11 \\ 6 & 3 & | & 5 \end{bmatrix} \\ A^T & \begin{bmatrix} A | \vec{b} \end{bmatrix} & & \begin{bmatrix} A^T A | A^T \vec{b} \end{bmatrix} \end{matrix}$ 可得： $\left\{\begin{matrix} 14 \widehat{b} + 6 \widehat{a} = 11 \\ 6 \widehat{b} + 3 \widehat{a} = 5 \end{matrix}\right.$ ，解得： $\left\{\begin{matrix} \widehat{b} = \dfrac{1}{2} \\ \widehat{a} = \dfrac{2}{3} \end{matrix}\right.$

所以 $\widehat{y} = \dfrac{1}{2} x + \dfrac{2}{3}$

打赏

制作不易，若有帮助，欢迎打赏！
赞赏码

支付宝付款码

关注

23
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

寒蜩 CSDN认证博客专家 CSDN认证企业博客

码龄1年

44: 原创

25万+: 周排名

2万+: 总排名

4万+: 访问

: 等级

1490: 积分

796: 粉丝

1050: 获赞

14: 评论

860: 收藏

私信

关注

热门文章

分类专栏

最新评论

出处不详阻拦投篮
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
HDOJ5616 Jam‘s balance
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
MIT线性代数笔记-第17讲-正交矩阵，Schmidt正交化
CSDN-Ada助手: 恭喜您在MIT线性代数笔记系列中已经写到了第19篇博客，内容涉及正交矩阵和Schmidt正交化，非常有深度和难度。希望您能继续保持创作的热情和耐心，坚持分享您的学习笔记，这对于他人的学习也是一种巨大的帮助。或许在下一篇博客中，您可以结合实际例子或者应用场景，让读者更好地理解和应用这些概念。期待您的下一篇作品，谢谢您的分享！
MIT线性代数笔记-第18讲-行列式及其性质
CSDN-Ada助手: 恭喜你完成了第20篇博客！标题中的主题听起来非常有深度和挑战性。你对MIT线性代数课程的学习进展令人钦佩，不仅持续学习，还能将所学知识转化为精彩的博客文章。在未来的创作中，我建议你可以尝试更多的实例和案例分析，以使读者更好地理解行列式及其性质的概念。此外，你还可以考虑加入一些个人观点和体会，以便我们更好地了解你对学习过程的理解和思考。继续保持对学术的热情和努力，我期待着你未来更多精彩的博客文章！
MIT线性代数笔记-第14讲-正交向量与空间
CSDN-Ada助手: 恭喜您第15篇博客的问世！标题中的"正交向量与空间"引起了我的兴趣。我很高兴看到您对线性代数的持续研究和分享。您的博客对于我们这些对数学感兴趣的读者来说是一个宝贵的资源。在下一步的创作中，我建议您可以继续探索正交向量和空间的相关概念，例如投影、Gram-Schmidt过程等。期待您的下一篇博客，再次感谢您的努力和分享！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

寒蜩 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。