机器学习的数学基础（6）：矩阵的SVD分解与最小二范数解

最新推荐文章于 2022-11-30 13:38:28 发布

面对疾风的小龙

最新推荐文章于 2022-11-30 13:38:28 发布

阅读量2k

点赞数 1

分类专栏：机器学习的数学基础文章标签：机器学习矩阵线性代数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43014877/article/details/121925317

版权

机器学习的数学基础专栏收录该内容

7 篇文章 7 订阅

订阅专栏

其实在上一篇文章中遗留了两个问题。在我们讨论最小二乘回归问题解的时候，当rank(A)<min(M,N)时，问题有二：1. 解的形式为 $\hat{x}+v$ 其中 $\hat{x}$ 为标准方程的解，在非满秩的情况下如何求得此时标准方程的一个解。2. 此时问题有无穷个解，我们应如何对这无穷个解进行选择。

解决上述问题，我们需要用到一个重要的数学工具: SVD

一. 奇异值分解（SVD）：

奇异值分解描述如下：

一个任意的矩阵A（M,N），rank(A)=R，可以被分解为如下的形式：

其中：

1. U是一个M*R维度的矩阵，且满足：

不难看出，因为 $AA^T$ 是一个M*M的方阵，因此可以对其做特征值分解， $\Sigma ^2$ 中的元素自然也是 $AA^T$ 所对应的特征值，且U可以被表示为：

$u_R$ 为U的特征向量。

2. V是一个N*R维度的矩阵，且满足：

同样的方式，我们表示出V，V为 $A^TA$ 所对应特征值分解的向量：

此外 $A^TA$ 和 $AA^T$ 所对应的特征值是相同的。

3. $\Sigma$ 则是矩阵A所对应的奇异值矩阵，是一个对角阵，满足：

矩阵中对角线上的元素均为矩阵A的奇异值，并且有先前的推导我们知道，奇异值实际上是 $A^TA$ 和 $AA^T$ 所对应的特征值的开方。

单从工程的角度求解奇异值，我认为以上的几个概念就够了，但是为了后续的数学推导做铺垫，我们还需要再度提及一些概念：

4. 当R<M时，矩阵 $AA^T$ 存在非平凡零空间，并且这个零空间我们可以表示为一组正交基底张成的空间如下：

其中

5. 当R<N时，矩阵 $A^TA$ 存在非平凡零空间，并且这个零空间我们可以表示为一组正交基底张成的空间如下：

其中：

铺垫做完了，接下来开始回答文中一开始所提出的问题。

二. 最小二乘的最小二范数解

对于上面的问题，当rank(A)<min(M,N)时，该问题存在无穷解，因此我们需要一种约束来挑选无穷个解中的其中一个作为我们的解，其中的一种挑选规则就是我们在所有解中挑选出具有最小二范数的解，建模如下：

求解上述的优化问题，我们则需要用到SVD。

首先对A进行SVD分解，我们有： $A=U\Sigma V^T$

先说结论，最终解可以被表示为如下形式：

其中前一项为 $\hat{x}$ ，后一项为v（A零空间中的元素）。而为了保证x的二范数最小，后一项v应为0，所以上述问题的解为

而我们把称之为矩阵A的伪逆

证明：

任何一个属于空间 $\mathbb{R}^n$ 的向量都可以被我们表示为：

这是因为V与V0的列向量为一组相互正交的向量且数量为n，因此V与V0的列向量张成的空间为 $\mathbb{R}^n$

并且由特征向量的性质我们有如下的关系：

镜像的我们对y也做同样的操作：

联立上述四个等式，我们有如下的推导：

那么最小二乘问题可以被我们表示为：

这里只要解出来 $\alpha$ ，带入即可求出x。

那么因为 $\beta _0$ 这一项是与y有关的，是一个常量，因此想让这个表达式最小，我们只需要做到

显然 $\Sigma$ 是可逆的，因此我们可以解出：

而为了保证x的二范数最小，后一项v应为0，所以上述问题的解为

得证！

面对疾风的小龙

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习的数学基础（6）：矩阵的SVD分解与最小二范数解

其实在上一篇文章中遗留了两个问题。在我们讨论最小二乘回归问题解的时候，当rank(A)<min(M,N)时，问题有二：1. 解的形式为其中为标准方程的解，在非满秩的情况下如何求得此时标准方程的一个解。2. 此时问题有无穷个解，我们应如何对这无穷个解进行选择。解决上述问题，我们需要用到一个重要的数学工具: SVD一. 奇异值分解（SVD）：奇异值分解描述如下：一个任意的矩阵A（M,N），rank(A)=R，可以被分解为如下的形式：其中：1. U是一个M*R维度的矩阵，且满
复制链接

扫一扫

专栏目录

面对疾风的小龙 CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

110万+: 周排名

32万+: 总排名

1万+: 访问

: 等级

89: 积分

12: 粉丝

8: 获赞

1: 评论

37: 收藏

私信

关注

热门文章

分类专栏

机器学习的数学基础 7篇

最新评论

openGauss中存储过程的使用详解
CSDN-Ada助手: 恭喜您写了第8篇博客！标题“openGauss中存储过程的使用详解”听起来非常有趣和实用。您对openGauss中存储过程的详细解释一定会帮助到很多读者，尤其是那些对此领域感兴趣的人。在下一步的创作中，我想建议您可以考虑探讨一些更深入的主题，或者分享一些您在使用openGauss存储过程时遇到的挑战和解决方案。这样可以帮助读者更好地理解和应用这些概念，并提供实际应用中的指导和建议。再次恭喜您，并期待您未来更多的博客文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。