【深度学习】数学基础——线代

最新推荐文章于 2022-08-15 20:28:27 发布

阳一子

最新推荐文章于 2022-08-15 20:28:27 发布

阅读量4.8k

点赞数 1

分类专栏：深度学习基础数学基础文章标签：深度学习人工智能线性代数

Phil Curiosity

本文链接：https://blog.csdn.net/qq_279033270/article/details/108985801

版权

深度学习基础同时被 2 个专栏收录

15 篇文章 4 订阅

订阅专栏

数学基础

2 篇文章 0 订阅

订阅专栏

0、基础

标量：0维数据，如常数0、1、2等单个数字。
向量：1维数据，如（1, 2），（2,3），（2,3,4）等点。
矩阵：2维数据，如[[1,3]，[2,8]] 的2维数组等。
张量：可以简单的理解为Pytorch、TensorFlow框架等对向量、矩阵数据特殊称呼。

1、基本运算和基本概念

加、减、数加、数减、数乘
叉乘(矩阵/张量的乘法)：行乘以列。

# 可用以下方法实现叉乘

a @ b    #Python方法
torch.matmul(a, b)   #Pytorch框架常用

矩阵的点乘：两矩阵形状相同，对应位置点相乘。（注：和向量的点乘不同）
转置
逆：逆运算相当于矩阵的除法运算，非奇异方阵才有逆

torch.inverse(a)  # torch框架      
np.linalg.inv(a)  # numpy框架

伪逆：伪逆是逆的推广，去除了方阵的限制

2、范数

范数是用来衡量数的大小

零范数：向量中非零元素的个数
一范数：向量中绝对值之和

║A║ = max{ ∑|ai1|，∑|ai2|，……，∑|ain| } （列和范数，A每一列元素绝对值之和的最大值）

║A║ = max{ ∑|a1i|，∑|a2i|，……，∑|ani| } （行和范数，A每一行元素绝对值之和的最大值）

二范数：向量的模
无穷范数：向量中的最大值
范数计算公式

$\left \| x \right \|_{p} = \left (\sum_i \left | x_{i} \right | ^{p}\right )^{\frac{1}{p} }$

归一化（部分）：

最大值归一化：每个值除以无穷范数
二范数归一化：每个值除以二范数

3、向量基概念及运算

内积与投影：对应位置相乘相加。内积的含义为向量a在向量b上的投影；反应两个向量的相似程度，不可以直接用来衡量相关性。
余弦相似度：

$cos\theta =\frac{\sum_{i=1}^{n}(A_{i}\times B_{i})}{\sqrt{\sum_{i=1}^{n}(A_{i})^{2}} \times \sqrt{\sum_{i=1}^{n}(B_{i})^{2}}}=\frac{A\cdot B}{\left | A \right |\times \left | B \right |}$

分母的意义：除以各自的模使其在同一坐标系或同一基向量中。

欧氏距离

$d(x,y) = \sqrt{(x_{1}-y_{1})^{2} + (x_{2}-y_{2})^{2}+\cdots +(x_{n}-y_{n})^{2}}=\sqrt{\sum_{i=1}^{n}(x_{i}-y_{i})^{2}}$

缺点：值域为[0，+∞)，不能直接比较；大小很模糊，不能度量

优点：简单

对两向量做二范数归一化所得的欧式距离等价于余弦相似度。

相关性

线性相关：
正相关：两向量夹角小于90°
负相关：两向量夹角大于90°
线性无关：两向量夹角等于90°

扩展：向量相似度的度量

4、行列式及特殊矩阵

行列式：二维为面积和三维及以上为体积。计算方式：

np.linalg.det(a)   # Numpy框架
b.det()            # Torch框架 b为torch.tensor()创建方阵；输入需要为float

特殊矩阵

方阵:矩阵的行数和列数相同
0、1矩阵

# 创建1矩阵
np.ones((3, 3))        
torch.ones(3, 3)
# 创建0矩阵
np.zeros((3, 3))        
torch.zeros(3, 3)

3. 单位矩阵

np.eye(n, m)       # n, m为单位矩阵维度
torch.eye(n, m)

4. 下三角矩阵：和其他矩阵作运算可以起到遮挡作用

np.tri(n,  m)        n, m为单位矩阵维度
torch.tril(torch.ones(n, m))

5. 奇异矩阵和非奇异矩阵

奇异矩阵：方阵且行列式为0
6. 斜对角矩阵：主对角线存在非0元素，其余元素全为0

np.diag([data])
torch.diag(torch.tensor([data]))  # [data]为主对角线元素，由列表构成

7. 稀疏矩阵
若数值为0的元素数目远远多于非0元素的数目，并且非0元素分布没有规律
非零元素的总数比上矩阵所有元素总数的值小于等于0.05

5、奇异值分解（SVD）

将非方阵分解为3个矩阵相乘。

上图为喜欢同一类型或相近类型书籍的一批用户对不同书籍的打分，我们现在需要通过对已知打分表X预测第一个用户对第4本书的购买欲望。则可以通过对矩阵X的进行SVD，可得到三个矩阵（上图缺少Σ权重矩阵）U、Σ、V，其中 Σ为特征值矩阵、U为用户的偏向权重矩阵、V为书内容受欢迎程度偏向权重矩阵。那么我们就可以通过U、V矩阵预估出第一个用户对第4本书的购买欲望。

import numpy as np

a = np.array([[12,3], [2,3],[7, 98]]) # 形状为（3,2）

u,s,v = np.linalg.svd(a)
print(u)
print(s)
print(v)

z = np.zeros((3,2))
z[0][0] = s[0]
z[1][1] = s[1]
print(z)
print(u@z@v)

# u
[[ 0.03974454  0.98792384 -0.149756  ]
 [ 0.03196212  0.14854076  0.98838963]
 [ 0.99869855 -0.04406961 -0.02567246]]

# s等价于下面的z
[98.37631919 11.87854464] 	#对角矩阵 形状应和原矩阵相同（3,2）

# v
[[ 0.07656059  0.99706493]
 [ 0.99706493 -0.07656059]]

# z为将s扩张成矩阵的结果
[[98.37631919  0.        ]
 [ 0.         11.87854464]
 [ 0.          0.        ]]

# a = u@z@v 
[[12.  3.]
 [ 2.  3.]
 [ 7. 98.]]