动手学深度学习——线性代数

最新推荐文章于 2024-04-29 15:47:47 发布

几帧从前_

最新推荐文章于 2024-04-29 15:47:47 发布

阅读量255

点赞数

文章标签： pytorch 线性代数深度学习

本文链接：https://blog.csdn.net/qq_41954153/article/details/119978221

版权

本文深入探讨了数学基础知识，如标量、向量和矩阵在人工智能领域的运用，包括它们的运算规则、长度计算、正交性和特殊矩阵的概念。此外，还介绍了矩阵乘法、特征向量与特征值、范数等重要概念，并通过Python的torch库展示了相关代码示例，揭示了这些数学工具在AI模型训练和数据处理中的核心作用。

摘要由CSDN通过智能技术生成

文章目录

代码

标量

简单操作
$\\ c = a \cdot b \\ c = sina$
长度
$\left \{ \begin{aligned} a \quad if a>0 \\ -a \quad otherwise\end{aligned} \right. \\ |a+b| \leq |a| + |b| \\ |a \cdot b| = |a|\cdot|b|$

向量

简单操作
$\quad where \quad c_i = a_i + b_i \\ c = \alpha \cdot b \quad where \quad c_i = \alpha b_i\\ c = sina \quad where \quad c_i = \sin a_i$
长度
$[\sum_{i=1}^m a_i^2]^{1 \over 2} \\ ||a|| \geq 0 \quad for \quad all \quad a \\ ||a+b|| \leq ||a|| + ||b|| \\ ||a \cdot b|| = |a|\cdot||b||$
点乘
$a^Tb = \sum_i a_ib_i$
正交
$a^Tb=\sum_ia_ib_i=0$

矩阵

简单操作
$\quad where \quad C_{ij} = A_{ij}+B_{ij} \\ C = \alpha \cdot B \quad where \quad C_{ij}= \alpha B_{ij} \\ C = sinA \quad where \quad C_{ij} = \sin A_{ij}$
乘法(矩阵乘以向量)
$\quad where \quad c_i = \sum_jA_{ij}b_j$
乘法(矩阵乘以矩阵)
$\quad where \quad C_{ik} = \sum_jA_{ij}B_{jk}$
范数
$A\cdot b \quad hence \quad ||c|| \leq ||A|| \cdot ||b||$
取决于如何衡量b和c的长度
常见范数：
1.矩阵范数：最小的满足的上面公式的值
2.Frobenius范数
$||A||_{Frob} = [\sum_{ij}A_{ij}^2]^{1 \over 2}$

特殊矩阵

对称和反对称 $A_{ij} = A_{ji} \quad and \quad A_{ij} = -A_{ji}$
正定
$||x||^2 = x^Tx \geq 0 \quad generalizes \quad to \quad x^TAx \geq0$
正交矩阵
1.所有行都相互正交
2.所有行都有单位长度 $\quad with \sum_jU_{ij}U_{kj} = \delta_{ik}$
3.可以写成 $UU^T = 1$
置换矩阵
$\quad where \quad P_{ij} =1 \quad if \quad and \quad only \quad if \quad j= \pi(i)$
置换矩阵是正交矩阵

特征向量和特征值
不被矩阵改变方向的向量
对称矩阵总是可以找到特征向量

代码

标量由只有一个元素的张量表示

import torch 
x = torch.tensor([3.0])
y = torch.tensor([2.0])

x + y,x * y, x / y, x**y

可以将向量视为标量组成的列表

x = torch.arrange(4)
x

通过张量的索引来访问任一元素

x[3]

访问张量的长度

len(x)

只有一个轴的张量，形状只有一个元素

x.shape

通过制定两个分量m和n来创建一个形状 $\times n$ 的矩阵

A = torch.arange(20).reshape(5,4)

矩阵的转置

A.T

对称矩阵A等于其转置： $A=A^T$

B = torch.tensor([[1,2,3],[2,0,4],[3,4,5]])
B == B.T

就像向量是标量的推广，矩阵是向量的推广一样，我们可以构建具有更多轴的数据结构

x = torch.arange(24).reshape(2,3,4)
x

给定任何相同形状的任何两个张量，任何按元素二元运算的结果都将是相同形状的张量

A = torch.arange(20,dtype=torch.float32).reshape(5,4)
B = A.clone()
A, A + B

两个矩阵的按元素乘法成为哈达玛积

A*B

表示任何形状张量的元素和

A.sum()

指定求和汇总张量的轴

A_sum_axis0 = A.sum(axis=0)
A_sum_axis1 = A.sum(axis=1)
A_sum_axis2 = A.sum(axis =[0,1])

求均值

A.mean(), A.sum()/A.numel()
A.mean(axis=0),A.sum(axis=0)/A.shape[0]

计算总和或均值时保持轴数不变

sum_A =A.sum(axis=1,keedims=True)

通过广播将A处以sum_A

A/sum_A

某个轴计算A元素的累积总和

A.cumsum(axis=0)

点积是相同位置的按元素乘积的和

x = torch.tensor([0,1,2,3])
y = torch.ones(4,dtype= torch.float32)
torch.dot(x,y)

我们可以通过执行按元素乘法，然后进行求和来表示两个向量的点积

torch.sum(x*y)

矩阵向量积 $A x$ 是一个长度为m的列向量，其 $i^{th}$ 元素是点积 $a_i^Tx$

torch.mv(A,x)

我们可以将矩阵-矩阵乘法AB看做是简单的执行m次矩阵-向量积，并将结果拼接在一起，形成一个 $\times m矩阵$

torch.mm(A,B)

L2范数是向量元素平方和的平方根

torch.norm(u)

L1范数表示向量元素的绝对值之和

torch.abs(u).sum()

矩阵的佛罗贝尼乌斯范数(Frobenius norm)是矩阵元素的平方和的平方根

torch.norm(torch.ones((4,9)))

几帧从前_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫