深度学习中的线性代数知识详解

最新推荐文章于 2021-04-23 21:53:35 发布

xialeizhou

最新推荐文章于 2021-04-23 21:53:35 发布

阅读量5.1k

点赞数 3

分类专栏：深度学习文章标签：深度学习线性代数

本文链接：https://blog.csdn.net/xialeizhou/article/details/81015420

版权

这篇博客详细介绍了深度学习中线性代数的基础知识，包括标量、向量和张量的概念，矩阵的转置、加法、乘法和逆矩阵，线性相关性及其在解线性方程组中的应用，以及范数和伪逆矩阵。还讨论了特征分解和奇异值分解（SVD）在理解和分析矩阵中的作用。

摘要由CSDN通过智能技术生成

1. 基础概念

标量(scalar)
一个标量就是一个单独的数，一般用小写的的变量名称表示。

向量(vector)
一个向量就是一列数，这些数是有序排列的:

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ x 1 x 2 . . . x 5 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

$\begin{bmatrix} x_1\\ x_2\\ ...\\ x_5 \end{bmatrix}$
矩阵(matrices)
矩阵是二维数组:

⎡ ⎣ ⎢ ⎢ ⎢ ⎢ a 11 a 21 . . . a m 1 a 12 a 22 . . . a m 2 . . . . . . . . . a 1 n a 2 n . . . a m n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

$\begin{bmatrix} a_{11}& a_{12}& ...& a_{1n}& \\ a_{21}& a_{22}& ...& a_{2n}& \\ ...& ...& & ...& \\ a_{m1}& a_{m2}& ...& a_{mn}& \end{bmatrix}$

张量(tensor)
多维数组中元素分布在若干位坐标的规则网络中, 称之为张量. 几何代数中定义的张量是基于向量和矩阵的推广，通俗一点理解的话，我们可以将标量视为零阶张量，矢量视为一阶张量，那么矩阵就是二阶张量。
张量在深度学习中是一个很重要的概念，因为它是一个深度学习框架中的一个核心组件，后续的所有运算和优化算法几乎都是基于张量进行的。

2. 矩阵相关

转置(transpose)
主对角线: 矩阵从左上角到右下角的对角线称为主对角线.矩阵的转置是指以主对角线为轴的镜像.
令矩阵 $\mathbf{A}$ 的转置表示为 $\mathbf{A}^T$ , 则定义如下:

((A) T) i, j = A i, j

$(\mathbf(A)^T)_{i,j}=A_{i,j}$
Tips:
向量是 单列矩阵, 向量的转置是 单行矩阵. 标量可看做 单元素矩阵, 因此标量的转置是它本身:

a=aT a = a T $a=a^T$ .

矩阵加法和广播:
矩阵加法定义: $\mathbf{C}=\mathbf{A}+\mathbf{B}$

在深度学习中, 允许矩阵和向量相加, 产生一个新的矩阵, 简写为: $\mathbf{C}=\mathbf{A}+\mathbf{b}$ , 表示向量 $\mathbf{b}$ 和矩阵 $\mathbf{A}$ 的每一行都相加. 这种隐式地幅值向量 $\mathbf{b}$ 到很多位置的方式成为广播.

矩阵乘法
分配律: $\mathbf{A(B+C)}$
结合律: $\mathbf{A(BC)=(AB)C}$
矩阵乘积不满足交换律: $\mathbf{AB\neq{BA}}$
向量点积满足交换律: $\mathbf{x^Ty=y^Tx}$
乘积的转置: $\mathbf{(AB)^T=B^TA^T}$

单位矩阵
主对角线元素都是1, 其余位置所有元素都是0的矩阵:

⎛ ⎝ ⎜ ⎜ 100010001 ⎞ ⎠ ⎟ ⎟

$\begin{pmatrix} 1& 0& 0 \\ 0& 1& 0 \\ 0& 0& 1 \end{pmatrix}$
我们将n维向量不变的单位矩阵即为

In I n $\mathbf{I_n}$ :

\forall x \in R n, I n x = x, 其 中 I n \in R n x n

$\forall \mathbf{x} \in R^n, \mathbf{I_nx = x}, 其中\mathbf{I_n \in R^{nxn}}$

逆矩阵
矩阵逆是强大的工具, 对于大多数矩阵, 都可以通过矩阵逆解析求

最低0.47元/天解锁文章

xialeizhou

关注

3
点赞
踩
39

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的线性代数知识详解

1. 基础概念标量(scalar) 一个标量就是一个单独的数，一般用小写的的变量名称表示。向量(vector) 一个向量就是一列数，这些数是有序排列的: ⎡⎣⎢⎢⎢⎢x1x2...x5⎤⎦⎥⎥⎥⎥[x1x2...x5]\begin{bmatrix}x_1\\ x_2\\ ...\\ x_5\end{bmatrix} 矩阵(matrices) 矩阵是二维数组: ⎡...
复制链接

扫一扫

专栏目录