深度学习（花书）数学符号

最新推荐文章于 2025-02-28 23:54:24 发布

LinusYxc

最新推荐文章于 2025-02-28 23:54:24 发布

阅读量1.8k

点赞数 2

分类专栏：机器学习&amp;amp;深度学习深度学习（花书）学习记录

机器学习&amp;深度学习同时被 2 个专栏收录

1 篇文章

订阅专栏

深度学习（花书）学习记录

1 篇文章

订阅专栏

数学符号

数和数组
集合和图
索引
线性代数中的操作
微积分
概率和信息论
函数
数据集合分布

数和数组

符号	含义
$a$	标量（整数或实数）
$\boldsymbol{a}$	向量
$\boldsymbol{\textit {A}}$	矩阵
$\boldsymbol{\mathrm{A}}$	张量
$\boldsymbol{I}_n$	n行n列的单位矩阵
$\boldsymbol{I}$	维度蕴含于上下文的单位矩阵
$\boldsymbol{e}^{(i)}$	标准基向量 $\dots, 0, 1, 0, \dots,0]$ ，其中索引I处值为1
$diag(\boldsymbol{a})$	对角方阵，其中对角元素有 $\bold{a}$ 给定
$\mathrm{a}$	标量随机变量
$\boldsymbol{\mathrm{a}}$	向量随机变量
$A$	矩阵随机变量

集合和图

符号	含义
$\mathbb{A}$	集合
$\mathbb{R}$	实数集
${0, 1\}$	包含0和1的集合
$\{0, 1, \dots, n\}$	包含0和n之间所有整数的集合
$[a, b]$	包含a和b的实数区间
$(a, b]$	不包含a但包含b的实数区间
$\mathbb{A}\setminus\mathbb{B}$	差集，即其元素包含于 $\mathbb{A}$ 但不包含于 $\mathbb{B}$
$\mathcal{G}$	图
$Pa_\mathcal{G}(x_i)$	图 $\mathcal{G}$ 中 $x_i$ 的父节点

索引

符号	含义
$a_i$	向量 $\bold{a}$ 的第 $i$ 个元素，其中索引从1开始
$a_{-i}$	除了第 $i$ 个元素，向量 $\bold{a}$ 的所有元素
$\boldsymbol{A}_{i,j}$	矩阵 $\boldsymbol{A}$ 的 $i, j$ 元素
$\boldsymbol{A}_{i,:}$	矩阵 $\boldsymbol{A}$ 的第 $i$ 行
$\boldsymbol{A}_{:,i}$	矩阵 $\boldsymbol{A}$ 的第 $i$ 列
$\boldsymbol{A}_{i,j,k}$	3维张量 $\boldsymbol{A}$ 的第 $(i, j, k)$ 元素
$\boldsymbol{A}_{:,:,k}$	3维张量 $\boldsymbol{A}$ 的2维切片
$\mathrm{a}$	随机向量 $\mathrm{a}$ 的第 $i$ 个元素，其中索引从1开始

线性代数中的操作

符号	含义
$\boldsymbol{A}^{\top}$	矩阵 $\boldsymbol{A}$ 的转置
$\boldsymbol{A}^+$	$\boldsymbol{A}$ 的Moore-Penrose伪逆
$\boldsymbol{A}\odot\boldsymbol{B}$	$\boldsymbol{A}$ 和 $\boldsymbol{B}$ 逐元素乘积（Hadamard乘积）
$\det\boldsymbol{A}$	$\boldsymbol{A}$ 的行列式

微积分

符号	含义
$\frac{\mathrm{d}y}{\mathrm{d}x}$	$y$ 关于 $x$ 的导数
$\frac{\partial y}{\partial x}$	$y$ 关于 $x$ 的偏导
$\nabla_{x}y$	$y$ 关于 $x$ 的梯度
$\nabla_{\boldsymbol{X}}y$	$y$ 关于 $\boldsymbol{X}$ 的矩阵导数
$\nabla_{\mathbf{X}}y$	$y$ 关于 $\mathbf{X}$ 求导后的张量
$\frac{\partial f}{\partial x}$	$f:\mathbb R^n\rightarrow\mathbb R^m$ 的Jacobian矩阵 $\boldsymbol{J}\in\mathbb R^{m\times n}$
$\nabla_{x}^{2}f(x) or \boldsymbol{H}(f)(x)$	$f$ 在点 $\boldsymbol{x}$ 处的Hessian矩阵
$\int f(x)\mathrm{d}x$	$x$ 整个域上的定积分
$\int_\mathbb{S} f(x)\mathrm{d}x$	集合 $\mathbb{S}$ 上关于 $x$ 的定积分

概率和信息论

符号	含义
$\perp b$	$a$ 和 $b$ 相互独立的随机变量
$P(\mathrm{a})$	离散变量上的概率分布
$p(\mathrm{a})$	连续变量（或变量类型未指定时）上的概率分布
$\mathrm{a} \sim P$	具有分布 $P$ 的随机变量 $\mathrm{a}$
$\mathbb{E}_{X\sim P}[f(x)] or \mathbb{E}f(x)$	$f (x)$ 关于 $P (x)$ 的期望
$V a r (f (x))$	$f (x)$ 在分布 $P (x)$ 下的方差
$C o v (f (x), g (x))$	$f (x)$ 和 $g (x)$ 在分布 $P (x)$ 下的协方差
$H (x)$	随机变量 $x$ 的香农熵
$D_{KL}(P\\|Q)$	$P$ 和 $Q$ 的 $K L$ 散度
$\mathcal{N}(\boldsymbol{x};\boldsymbol{\mu},\boldsymbol{\Sigma})$	均值为 $\boldsymbol{\mu}$ 协方差为 $\boldsymbol{\Sigma}$ ， $\boldsymbol{x}$ 上的高斯分布

下面因为单竖线不能加到表格中
$\perp b | c$ ：给定 $c$ 后条件独立

函数

符号	含义
$f:\mathbb{A}\rightarrow\mathbb{B}$	定义域为 $\mathbb{A}$ 值域为 $\mathbb{B}$ 的函数 $f$
$\circ g$	$f$ 和 $g$ 的组合
$f(\boldsymbol{x};\boldsymbol{\theta})$	由 $\boldsymbol{\theta}$ 参数化，关于 $x$ 的函数，有时为简化表示，我们忽略 $\boldsymbol{\theta}$ 记为 $f(\boldsymbol{x})$
$\log x$	$x$ 的自然对数
$\sigma(x)$	Logistic sigmoid， $\frac{1}{1+\exp(-x)}$
$\zeta(x)$	Softplus， $log({1+\exp(-x)})$
$\lVert\boldsymbol{x}\rVert_p$	$x$ 的 $L^p$ 范数
$\lVert\boldsymbol{x}\rVert$	$x$ 的 $L^2$ 范数
$x^+$	$x$ 的正数部分，即 $\max(0,x)$
$1_{condition}$	如果条件为真则为1，否则为0

有时候我们使用函数 $f$ ，它的参数是一个标量，但应用到一个向量、矩阵或张量： $f (x)$ ， $f (X)$ ，or $f(\boldsymbol{X})$ 。这表示逐元素地将 $f$ 应用于数组。例如， $\boldsymbol{C}=\sigma(\boldsymbol{X})$ ，则对于所有合法的 $i, j$ 和 $k$ ， $C_{i,j,k}=\sigma(X_{i,j,k})$ 。

数据集合分布

符号	含义
$p_{data}$	数据生成分布
$\hat p_{train}$	由训练集定义的经验分布
$\mathbb{X}$	训练样本的集合
$\boldsymbol{x}^{(i)}$	数据集的第 $i$ 个样本（输入）
$y^{(i)} or \boldsymbol{y}^{(i)}$	监督学习中与 $\boldsymbol{x}^{(i)}$ 关联的目标
$\boldsymbol{X}$	$m\times n$ 的矩阵，其中行 $\boldsymbol{X}_{i,:}$ 为输入样本 $\boldsymbol{x}^{(i)}$