人工智能 — 数学基础

最新推荐文章于 2024-05-03 11:07:56 发布

永远十八的小仙女~

最新推荐文章于 2024-05-03 11:07:56 发布

阅读量396

点赞数 13

分类专栏：人工智能文章标签：人工智能计算机视觉

本文链接：https://blog.csdn.net/muyuhen/article/details/135897361

版权

人工智能专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一、向量

具有大小和方向的量。
$\stackrel{\rightarrow}{a} = (x, y)$
在这里插入图片描述

二、线性变换

线性变换通常用一个矩阵表示。

设 T 是一个从向量空间 V 到向量空间 W 的线性变换，对于 V 中的每个向量 x，存在一个矩阵 A，使得 T(x) = Ax，其中 A 是一个固定的矩阵。

加法保持性质

对于任意两个向量 x 和 y，线性变换 T 满足 T(x + y) = T(x) + T(y)。

标量乘法保持性质

对于任意标量 c 和向量 x，线性变换 T 满足 T(cx) = cT(x)。

三、矩阵

1、概念

矩阵是一个由数字排列成的矩形阵列，其中包含 m 行 n 列的数学对象。
$\begin{bmatrix} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \ldots & a_{mn} \end{bmatrix}$

$其中 a_{ij} 表示矩阵中第 i 行第 j 列的元素$

2、加减法

矩阵的加法和减法按元素进行，即对应位置上的元素相加或相减。

两个相同维度的矩阵（两个矩阵的列数和行数一致）才能相加或相减。
$\Rightarrow c_{ij} = a_{ij} + b_{ij}$

$\begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix} ，B = \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix} ，C = A + B = \begin{bmatrix} 3+5 & 1+2 \\ 2+1 & 4+6 \end{bmatrix} = \begin{bmatrix} 8 & 3 \\ 3 & 10 \end{bmatrix}$

$\begin{bmatrix} 7 & 4 \\ 3 & 9 \end{bmatrix}， Y = \begin{bmatrix} 2 & 1 \\ 5 & 2 \end{bmatrix}，Z = X - Y = \begin{bmatrix} 7-2 & 4-1 \\ 3-5 & 9-2 \end{bmatrix} = \begin{bmatrix} 5 & 3 \\ -2 & 7 \end{bmatrix}$

3、乘法

矩阵的乘法不同于加法，是按行和列进行的。

如果矩阵 A 的列数等于矩阵 B 的行数，则它们可以相乘。
$\Rightarrow c_{ij} = \sum_{k=1}^{n} a_{ik} \cdot b_{kj}$

$\begin{bmatrix} 2 & 3 \\ 4 & 1 \end{bmatrix}，B = \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix}$
$\begin{bmatrix} 2 × 5 + 3 × 7 & 2 × 6 + 3 × 8 \\ 4 × 5 + 1 × 7 & 4 × 6 + 1 × 8 \end{bmatrix} = \begin{bmatrix} 31 & 34 \\ 27 & 28 \end{bmatrix}$

$\begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix}，B = \begin{bmatrix} 9 & 8 & 7 \\ 6 & 5 & 4 \\ 3 & 2 & 1 \end{bmatrix}$
$\begin{bmatrix} 1 × 9 + 2 × 6 + 3 × 3 & 1 × 8 + 2 × 5 + 3 × 2 & 1 × 7 + 2 × 4 + 3 × 1 \\ 4 × 9 + 5 × 6 + 6 × 3 & 4 × 8 + 5 × 5 + 6 × 2 & 4 × 7 + 5 × 4 + 6 × 1 \\ 7 × 9 + 8 × 6 + 9 × 3 & 7 × 8 + 8 × 5 + 9 × 2 & 7 × 7 + 8 × 4 + 9 × 1 \end{bmatrix} = \begin{bmatrix} 30 & 26 & 22 \\ 84 & 71 & 58 \\ 138 & 116 & 94 \end{bmatrix}$

$\begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix}，B = \begin{bmatrix} 7 & 8 \\ 9 & 10 \\ 11 & 12 \end{bmatrix}$

$\times B = \begin{bmatrix} 1 \times 7 + 2 \times 9 + 3 \times 11 & 1 \times 8 + 2 \times 10 + 3 \times 12 \\ 4 \times 7 + 5 \times 9 + 6 \times 11 & 4 \times 8 + 5 \times 10 + 6 \times 12 \end{bmatrix} = \begin{bmatrix} 58 & 64 \\ 139 & 154 \end{bmatrix}$

$\times A = \begin{bmatrix} 7 \times 1 + 8 \times 4 & 7 \times 2 + 8 \times 5 & 7 \times 3 + 8 \times 6 \\ 9 \times 1 + 10 \times 4 & 9 \times 2 + 10 \times 5 & 9 \times 3 + 10 \times 6 \\ 11 \times 1 + 12 \times 4 & 11 \times 2 + 12 \times 5 & 11 \times 3 + 12 \times 6 \end{bmatrix} = \begin{bmatrix} 39 & 54 & 69 \\ 49 & 68 & 87 \\ 59 & 82 & 105 \end{bmatrix}$

4、单位矩阵

单位矩阵是一个特殊的方阵，主对角线上的元素全为1，其余元素为0。
$表示为 I 或 I_{n}，其中 n 是矩阵的阶数$

$\begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}$

$\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}$

$\begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix}$

$\begin{bmatrix} 1 & 0 & \ldots & 0 \\ 0 & 1 & \ldots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \ldots & 1 \end{bmatrix}$

如果 A 是 n×n 矩阵，I 是单位矩阵，则 AI= A，IA = A
$\begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix}×\begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}= \begin{bmatrix} 1 × 3 + 0 × 2 & 1 × 1 + 0 × 4 \\ 0 × 3 + 1 × 2 & 0 × 1 + 1 × 4 \end{bmatrix} = \begin{bmatrix} 3 & 1 \\ 2 & 4 \end{bmatrix}$

$\begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}× \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix}= \begin{bmatrix} 5 × 1 + 2 × 0 & 5 × 0 + 2 × 1 \\ 1 × 1 + 6 × 0 & 1 × 0 + 6 × 1 \end{bmatrix} = \begin{bmatrix} 5 & 2 \\ 1 & 6 \end{bmatrix}$

单位矩阵在矩阵乘法中的作用相当于数字1。

5、逆矩阵

$A^{-1}，满足 A \cdot A^{-1} = A^{-1} \cdot A = I，I 是单位矩阵。$

$\begin{bmatrix} 2 & 3 \\ 4 & 5 \end{bmatrix} ，A^{-1} = \frac{1}{ad - bc} \begin{bmatrix} d & -b \\ -c & a \end{bmatrix} ，A^{-1} = \frac{1}{-2} \begin{bmatrix} 5 & -3 \\ -4 & 2 \end{bmatrix} = \begin{bmatrix} -\frac{5}{2} & \frac{3}{2} \\ 2 & -1 \end{bmatrix}$

$\begin{bmatrix} 3 & -4 \\ 2 & -5 \end{bmatrix}，A^{-1} = \frac{1}{ad - bc} \begin{bmatrix} d & -b \\ -c & a \end{bmatrix}，A^{-1} = \frac{1}{-7} \begin{bmatrix} -5 & 4 \\ -2 & 3 \end{bmatrix} = \begin{bmatrix} \frac{5}{7} & -\frac{4}{7} \\ \frac{2}{7} & -\frac{3}{7} \end{bmatrix}$

6、奇异矩阵

当一个矩阵没有逆矩阵的时候，称该矩阵为奇异矩阵。

当且仅当一个矩阵的行列式为零时，该矩阵是奇异矩阵。
$\begin{bmatrix} 2 & 4 \\ 1 & 2 \end{bmatrix}，\text{Determinant}(A) = (2 × 2) - (4 × 1) = 0$

7、矩阵的转置

矩阵的转置是将其行和列互换得到的新矩阵。

$\begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix}，A^T = \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{bmatrix}$
转置运算特性

对称矩阵的转置

$A^T = A$

转置的转置

$A^T)^T = A$

矩阵加法的转置

$A + B)^T = A^T + B^T$

矩阵乘法的转置

$AB)^T = B^T A^T$

标量乘法的转置

$cA)^T = c A^T$

8、对称矩阵

如果一个矩阵转置后等于原矩阵，那么这个矩阵称为对称矩阵。

一个矩阵转置和这个矩阵的乘积就是一个对称矩阵。
$A^T = A$

$\begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix}， A^T = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix} = A$

$A^T×A)^T = A^T×(A^T)^T=A^TA$

$\begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}$
$(A^T \times A)^T = \left(\begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}\right)^T= A^T \times (A^T)^T = \begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix} = A^T \times A = \begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix} \times \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}$

9、欧氏变换

两部分组成：旋转和平移。
$a^{'} = R a + t$
在这里插入图片描述

10、齐次坐标

就是用 N+1 维来代表 N 维坐标。

两个矩阵运算时，大小不一样，可以使用齐次坐标补齐成行列大小一致后运算。

可以在一个二维坐标末尾加上一个额外的变量 w 来形成二维齐次坐标。

因此，一个点 (X,Y) 在齐次坐标里面变成了（x,y,w），并且有 X = x/w，Y = y/w。

例如：(1,2) 的齐次坐标可以表示为 (1,2,1)。

如果点 (1,2) 移动到无限远处，在笛卡尔坐标下它变为 (∞,∞)，然后它的齐次坐标表示为 (1,2,0) ，因为 (1/0, 2/0) = (∞,∞)，就可以不用 “∞” 来表示一个无穷远处的点了，这样方便做运算。

四、导数&偏导数

导数（微分）：

是代表函数（曲线）的斜率，是描述函数（曲线）变化快慢的量，同时曲线的极大值点也可以使用导数来判断，即极大值点的导数为0，此时斜率为0。

偏导数：

是指在多元函数的情况下，对其每个变量进行求导，求导时，把其它变量看做常量进行处理，物理意义就是查看这一个变量在其它情况不变的情况下对函数的影响程度。
$f'(x_0)= \lim_{{\Delta x \to 0}}\frac{\Delta y}{\Delta x} = \lim_{{\Delta x \to 0}} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}$
在这里插入图片描述

五、梯度

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

简而言之，对多元函数的各个自变量求偏导数，并把求得的这些偏导数写成向量形式，就是梯度。
$\nabla f(x_0,y_0) = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right)$
梯度下降法