深度学习涉及到的线性代数知识点总结（二）

最新推荐文章于 2024-04-27 10:42:25 发布

雨落的太敷衍..

最新推荐文章于 2024-04-27 10:42:25 发布

阅读量1.6k

点赞数 1

分类专栏：深度学习文章标签：深度学习线性代数矩阵

本文链接：https://blog.csdn.net/liu1073811240/article/details/109954673

版权

深度学习专栏收录该内容

33 篇文章 14 订阅

订阅专栏

文章目录

一、余弦相似度和欧式距离的关系
二、相关性
三、基
四、线性变换
五、仿射变换
六、矩阵特征方程
七、相似矩阵
八、奇异值分解
九、谱范数

一、余弦相似度和欧式距离的关系

在这里插入图片描述
如果对向量模长进行归一化，欧式距离和余弦相似度有如下计算关系：

● 适用场景
余弦相似度计算的向量的夹角，它并不关心向量的绝对大小。
欧式距离体现的是数值上的绝对差异。

● 结论
做了标准化后，余弦相似度与欧式距离成正比（等价性）。

二、相关性

● 公式
在这里插入图片描述
相关性分为线性相关（正、负）和线性无关、

● 通俗理解
你可以把向量想成一个一个的人，这些人构成一个小组(以下举例A、B、C三人）。
线性相关：如果该组有一个人（A）能完成的工作，其他成员（B+ 0C、0B+C、K1B+K2C…)也能完成，那么该人就是“多余”的，没有他工作也能完成。

线性无关：该组每个人都是各个领域的大牛，没有其他人能代替他们完成相应的工作，他们独一无二的，少了一个都不行。
在高等数学里面，向量二维和三维相关，就是共线（坐标对应成比例）和共面的问题。。

三、基

● 正交基
不相关的（正交）向量组成的空间。
在这里插入图片描述
两个向量相乘为0称这两个向量正交，零向量与任何向量正交。

● 标准基
标准基表示一组长度为1的基

● 标准正交基
标准正交基表示一组长度为1且两两正交的基。

● 完备基
由两两不相关的正交基组成的方阵，它能够表达一个完整的空间。
在这个空间中的任何一个点，都可以由这三个基(轴)来表示。

● 欠完备基
不能够表达一个完整空间的基的组合，比如非正交基的组合以及非方阵的组合，比如用两个向量表示一个三维空间，或者用四个向量表示一个三维空间(必定存在两个向量是相关的)

四、线性变换

● 本质
给一个向量乘以一个变换矩阵(完备基)，形成新的向量，这个新的向量就是被变换后的向量。一个向量A和另一个向量B的内积，相当于A在B上的投影(投影会降维)，乘以矩阵就是多段投影。

● 方法

在当前空间坐标系中改变目标向量(标量、矩阵)
目标向量(标量、矩阵)和当前栈空间坐标系作为整体一起改变。

● 图形
在这里插入图片描述
对一个向量x的变换步骤:把x的特征分解到一个新的矩阵A的轴.上，然后再用分解到这个矩阵A的轴上的特征乘以原来的轴，得到新的特征，新的矩阵轴上的新的特征交点就是变换后的向量Ax.

五、仿射变换

仿射变换（Affine Transformation或 Affine Map）是一种二维坐标到二维坐标之间的线性变换，它保持了二维图形的“平直性”（即：直线经过变换之后依然是直线）和“平行性”。
（即：二维图形之间的相对位置关系保持不变，平行线依然是平行线，且直线上点的位置顺序不变）。
在这里插入图片描述

六、矩阵特征方程

● Ax = λx
含义:一个矩阵A乘以一个(特征向量)向量x等于一个标量(特征值) λ乘以一个(特征向量)向量x。

● 推理公式：vAx = vλx

等式左边: 一个向量v乘以一个矩阵A,相当于对向量v做了一次线性变换，然后变换后的v向量再乘以一个特征向量x，就相当于变换后的v向量在x向量上的投影，是一个标量。
等式右边:一个向量v乘以一个标量(特征值) λ,相当于对这个向量做一个一次线性变换，然后变换后的向量v再乘以一个特征向量λ，相等于变换后的v向量在x向量上的投影，也是一个标量。

● 意义

使用标量λ来代替矩阵A，主要是为了方便观察这个向量v在变换后在向量x上投影的变化方向。
特征值λ就是向量v经过变换后投影到x上的值，特征值λ越大，说明这个向量v在这个x轴上的变换越大，越重要。

● 目的
表示一个向量变化之后在某个轴上的投影。

● 图像
在这里插入图片描述

● 推理
AX=λX, λX-AX=0，可得(λE-A) X=0

七、相似矩阵

● 公式
在这里插入图片描述

● 条件
要求P是正交阵，否则需要通过求伪逆的方式实现。

● 意义

对一个矩阵做相似变换
想把一个矩阵A变成矩阵B,只需要找到一个矩阵P，做一个相似变换即可。
相似矩阵的本质就是两组不同的基都代表了同一个空间，这两组基之间存在一个转换关系，就是矩阵P.

● 公式推导
因为P是正交阵，所以P^(-1)AP= B可以写成P^TAP=B。

● 变换公式

P^(-1)AP=B， PP^(-1)=E, AE=A, A=B
AP=PB，A=B, A和B就是相似矩阵P
用AP= PB对比特征方程Ax=λx,发现二者非常相似，如
果把x和λ都换成矩阵P和B，特征方程的公式就可以是
AP=BP

● vAP = vPB

八、奇异值分解

● 定义
相似矩阵P^(-1)AP=B中，当P不是方阵的时候，A矩阵
的特征值被称为奇异值。

● 公式
A=U∑V^T

● 推理
可见，特征值只是相对于方阵而言的，而奇异值是相对于所有矩阵而言的，可以认为特征值是一种特殊的奇异值。
因为在P^(-1)AP=B中，P不是方阵，所以公式被写成了
A=U∑V^T。

● 意义

可以做推荐系统算法
降维，取消不重要的奇异值

九、谱范数

● 定义
最大的特征值被称为矩阵的谱范数

● 简述

矩阵的特征值被称为谱
用谱范数做归一化被称为谱范数归一化

● 应用
例如度量一个矩阵的大小，判断算法是否收敛等。

雨落的太敷衍..

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
深度学习涉及到的线性代数知识点总结（二）

文章目录一、余弦相似度和欧式距离的关系二、相关性三、基四、线性变换五、仿射变换六、矩阵特征方程七、相似矩阵八、奇异值分解九、谱范数一、余弦相似度和欧式距离的关系如果对向量模长进行归一化，欧式距离和余弦相似度有如下计算关系：● 适用场景       余弦相似度计算的向量的夹角，它并不关心向量的绝对大小。       欧式距离体现的是数值上的绝对差异。●
复制链接

扫一扫

专栏目录