线性代数|机器学习-P11方程Ax=b求解研究

取个名字真难呐

已于 2024-06-09 22:25:29 修改

阅读量1.4k

点赞数 26

文章标签：线性代数机器学习人工智能

于 2024-06-09 19:05:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/scar2016/article/details/139564826

版权

文章目录

1. 变量数和约束条件数大小分类
2. 最小二乘法和Gram-schmidt变换
3. 迭代和随机采样
- 3.1 迭代
- 3.2 随机采样

1. 变量数和约束条件数大小分类

0 用伪逆矩阵 $x=A^{+}b$ 直接求解，[上一节已讲]
1 当矩阵A大小适中，条件数 $\frac{\sigma_1}{\sigma_r}<1000时$ ，用 $\ b x=A\backslash b$ ；
2 当矩阵A列满秩m>n=r时，方程数多于变量数，无法求解，只能择中找近似解，将b投影到矩阵A的列空间中后，再找到近似解 $\hat{x}$ 用 $A^TA\hat{x}=A^Tb\rightarrow \hat{x}=(A^TA)^{-1}A^Tb$
3 当矩阵m < n时，方程数小于变量数，有无穷多的解，约束不够，所以我们增加 $L_1,L2$ 约束来在众多的解中拿到一个好的解，这是深度学习中最重要的损失函数解决思路。

2. 最小二乘法和Gram-schmidt变换

2.1 Gram-schmidt变换

4 列向量情况很差，条件数 $\frac{\sigma_1}{\sigma_r}>1000$ ，就是病态矩阵，简单理解就是矩阵A的列向量之间相关性太大，导致无法用相关性的列表示其他向量；
当我们矩阵A的列向量为 $a_1,a_2$ 时候，我们用 $a_1,a_2$ 表示 $v_3$ 时候，特别不方便， $a_1,a_2$ 越相近，越不方便，就是所说的列向量相关性太大，那gram-schmidt的方式就是，既然 $a_1,a_2$ 太接近，那就改造其中一个，我们把 $a_1$ 经过投影和相减后得到 $a_{11}$ ，那么 $a_{11}\perp a_2$ ，这样我们就用新的正交向量 $a_{11},a_3$ 来表示 $v_3$ . 将A分解为QR后就可以得到最优解 $\hat{x}$ ，具体推导可以看上一节内容。另外一种是通过将列进行旋转，原理和行的交换一样，主要是关于数值稳定性的问题，保证不要出现大数吃小数的现象发生。

2.2 最小二乘法

2.2.1 损失函数-Lasso 和regression

5 矩阵A接近奇异矩阵，该矩阵的值不是满秩，无法进行直接求逆得到 $A^{-1}$ 逆矩阵，就是会得到很多的解，我们的目的是从这么多的解中找到一个最好的解，目前加 $L_1$ 项，即加 $\lambda||x||_1$

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。