这一篇博文是【 AI学习路线图】系列文章的其中一篇,点击查看目录:AI学习完整路线图
1.向量
向量是既有大小又有反向的量,是指具有n个相互独立的性质(维度)的对象的表示,向量常使用字母加箭头的形式进行表示,也可以使用几何坐标来表示向量,比如 a⃗ =OP→=xi+yj+zk ,也可以用坐标 (i,j,k) 表示向量。
-
向量的模
- 向量的模就是向量的大小,也就是向量的长度,是向量坐标到圆点的距离,记作 |a| 。 单位向量
- 长度为一个单位(即模为1)的向量是单位向量。 向量的加减运算
-
设向量
a⃗ =(x1,y1)
,向量
b⃗ =(x2,y2)
。
向量的加法满足平行四边形法则,向量的减法满足三角形法则。
a⃗ +b⃗ =(x1+x2,y1+y2)
a⃗ −b⃗ =(x1−x2,y1−y2)
-
数乘运算
-
实数
λ
和向量的叉乘乘积还是一个向量,记作
λa
,且
|λa|=λ|a|
。
数乘的几何意义是将向量a进行伸长或者压缩操作。
设向量 a⃗ =(x1,y1) ,它和实数 λ 相乘为: λa⃗ =(λx,λy)
数量积和向量积
-
设向量
a⃗ =(x1,y1)
,向量
b⃗ =(x2,y2)
,并且
a⃗
和
b⃗
之间的夹角为
θ
(1) 数量积 :两个向量的数量积(内积、点积)是一个数量(实数),记作 a⃗ ⋅b⃗
a⃗ ⋅b⃗ =|a⃗ |∗|b⃗ |∗cosθ
是 a⃗ 的模乘以 b⃗ 的模,再乘以 cosθ
(2) 向量积:两个向量的向量积(外积、叉积)是一个向量,记作 a⃗ ×b⃗ 。向量积是两个不共线非零向量所在平面的一组法向量。|a⃗ ×b⃗ |=|a⃗ |∗|b⃗ |∗sinθ
正交向量
-
如果两个向量的点积为零,那么这两个向量互为正交向量;在几何意义上来讲,正交向量在二维/三维空间上其实就是两个向量垂直。
如果两个或者多个向量他们的点积均为0,那么它们互称为正交向量。
2.线性
线性是指变量与变量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数;
非线性是指不成比例、没有直线关系,一阶导数不是常数的函数。
线性代数中的基本量指的是向量,基本关系是严格的线性关系;也就是可以简单的将线性代数理解为向量与向量之间的线性关系的映射。
3.矩阵
矩阵是描述线性代数中线性关系的参数,即矩阵是一个线性变换,可以将一些向量转换为另一些向量。
初等代数中
y=ax
表示的是x到y的一种映射关系,其中
a
是描述这种关系的参数。
线性代数中,
- 方阵
- 如果矩阵A中行的数量和列的数量一样都为m,那么称矩阵为m阶方阵。
- 零矩阵
- 如果矩阵中
A 的所有元素(m*n)都为0,那么这个矩阵A叫做零矩阵,可以记作0。 单位矩阵- n阶方阵中主对角线上的元素均为1,其他元素都为0,那么此时的n阶方阵叫做n阶单位矩阵,单位矩阵常用E或者I表示。
矩阵的加减法- 要求两个矩阵具有相同的阶,比如A、B都是 m∗n 阶的矩阵,矩阵的加减是对应元素的加减,结果还是一个 m∗n 阶的矩阵。
矩阵的数乘
A+B=B+A
(A+B)+C=A+(B+C)- 将数 λ 与矩阵 A 相乘,就是将数
矩阵与向量相乘λ 与矩阵 A 中的每一个元素相乘,记作λA
(λμ)A=λ(μA)
(λ+μ)A=λA+μA
λ(A+B)=λA+λB- 一个 m∗n 阶的矩阵,只能跟 n∗1 的向量相乘,最后得到的是 m∗1 的矩阵,这个相当于矩阵跟矩阵相乘。
矩阵与矩阵相乘- 只有当第一个矩阵的列数和第二个矩阵的行数相同时候才能够定义,比如: m∗s 的矩阵跟 s∗n 的矩阵相乘,得到的是 m∗n 的矩阵。
矩阵的转置- 把矩阵A的行和列相互交换所产生的矩阵称为A的转置矩阵。这一过程叫做矩阵的转置。
k阶子式
(AT)T=A
(λA)T=λAT
(AB)T=BTAT- 在 m∗n 矩阵中,任取k行k列,不改变这 k∗2 个元素的在A中的次序,得到k阶方阵,称为矩阵A的k阶子式。
矩阵的秩
m∗n 阶矩阵A中的k阶子式有 CkmCkn 个。- 设在矩阵中A中有一个不等于0的r阶子式D,切所有的r+1阶子式(如果存在)全等于0,那么D称为矩阵A的最高阶非零子式,r称为矩阵A的秩,记作R(A)=r。
- n*n的可逆矩阵,秩为n
- 可逆矩阵又称为满秩矩阵
- 矩阵的秩等于它行列向量组的秩
不相关的向量的最大子式阶数。
-
方阵行列式
-
(1)行列式是数学的一个函数,可以看做在几何空间中,一个线性变换的对“面积”/“体积”的影响。
(2)n阶方阵行列式可以表示为 |A| 。
1 × 1的方阵,其行列式等于该元素本身。
2 × 2的方阵,其行列式用对角线元素的乘积减去次对角线元素的乘积 A=(a11a21a12a22)|A|=a11∗a22−a12∗a21
3 × 3 的方阵的行列式
A=⎧⎩⎨⎪⎪a11a21a31a12a22a32a13a23a33⎫⎭⎬⎪⎪
计算多阶的方阵行列式,可以在左右模拟出来一个备份,来计算对角线,如下所示:
A=⎧⎩⎨⎪⎪a11a21a31a12a22a32a13a23a33⎫⎭⎬⎪⎪⎧⎩⎨⎪⎪a11a21a31a12a22a32a13a23a33⎫⎭⎬⎪⎪⎧⎩⎨⎪⎪a11a21a31a12a22a32a13a23a33⎫⎭⎬⎪⎪那么行列式
|A|=∑i=13ri−∑i=13li=a11a22a33+a12a23a31+a13a21a32−a13a22a31−a12a21a33−a11a23a32就是3个对角线的乘积和减去3个次对角线的乘积和。
-
余子式
- 在一个n阶的行列式中,把元素 aij 所在的行和列划去,剩下的元素按照原来的次序组成了一个n-1阶的行列式 Mij ,称为元素 aij 的余子式。 代数余子式
- 上面说的余子式 Mij 带上符号 (−1)i+j 称为 aij 的代数余子式,结果是1或者-1,记作 Aij=(−1)i+jMij 。 伴随矩阵
- 对于n阶方阵的任意元素 aij 都有各自的代数余子式,将所有的代数余子式按照次序排列出来,可以得到一个n阶的方阵 A∗ ,那么 A∗ 称为A的伴随矩阵。 方阵的逆
-
设A是数域上的一个n阶方阵,若在相同的数域上存在另一个n阶方阵B,使得AB=BA=E(E是单位矩阵),那么称B为A的逆矩阵,而A被称为可逆矩阵或者非奇异矩阵,如果A不存在逆矩阵,那么A称为奇异矩阵,A的逆矩阵记作
A−1
。
具有以下性质:
(1) 如果矩阵A是可逆的,那么矩阵A的逆矩阵是唯一的
(2)A的逆矩阵的逆矩阵还是A,记作 (A−1)−1=A
(3)可逆矩阵A的转置矩阵 AT 也可逆,并且 (AT)−1=(A−1)T
(4)若矩阵A可逆,则矩阵A满足消去律,即AB=AC可以得到B=C
(5)矩阵A可逆的充要条件是行列式 |A| 不等于0
系数矩阵
-
如果向量组A乘以一个矩阵K得到向量组B,那么就说B可以由A和K线性表示,K就是系数矩阵。
(a1,a2,⋯am)⋅⎡⎣⎢⎢⎢k11k21⋯km1k12k22⋯km2⋯⋯⋯⋯k1nk2n⋯kmn⎤⎦⎥⎥⎥=(b1,b2,b3,⋯bn)
正交矩阵
-
若n阶方阵A满足
ATA=E
,(A的转置乘以A是个单位阵)则称A为正交矩阵,简称正交阵。
A是正交阵的充要条件是:A的列向量、行向量都是单位向量,且两两正交。
如A是正交矩阵,x是向量,则称Ax称为正交变换。
性质:
(1) 若A为 正交矩阵,那么A的逆矩阵 A−1 也是正交矩阵。
(2) 若P、Q是正交矩阵,那么P*Q也是正交矩阵。
对称矩阵
-
元素以对角线为对称轴,对应相等的矩阵就叫做对称矩阵。
对称矩阵的特性:
(1)对称矩阵中 aij 等于 aji
(2)对称矩阵一定是方阵,并且对于任何的方阵A, A+AT 是对称矩阵。
(3)除对角线外的其他元素均为0的矩阵叫做 对角矩阵。
(4)矩阵中每个元素都是实数的对称矩阵叫做 实对称矩阵
正定矩阵
-
对于n阶方阵A,若任意n阶向量x,都有
xTAx>0
,则称矩阵A为正定矩阵。
若 XTAx>=0 ,则矩阵A为半正定矩阵。
性质:
(1) 正定矩阵的任意主子矩阵也是正定矩阵
(2)若A为n阶正定矩阵,则A为n阶可逆矩阵。
4.特征值和特征向量
-
特征值
-
A为n阶矩阵,若数
λ
和n维非0向量
x
满足
Ax=λx ,那么数 λ 称为A的特征值。
特征向量
-
上面的
x
称为A的对应于特征值
λ 的特征向量。
特征多项式
- 上面的 |λE−A| 叫做A的特征多项式。
5.奇异矩阵
如果方阵A的行列式的值等于0,那么方阵A叫做奇异矩阵,否则叫做非奇异矩阵。
非奇异矩阵 ⟺ 可逆矩阵:非奇异矩阵是可逆的,可逆的矩阵也是非奇异矩阵。
-
奇异矩阵的性质
-
(1)如果A为奇异矩阵,则Ax=0有无穷解,Ax=b有无穷解或者无解。
(2)如果A为非奇异矩阵,则Ax=0有且只有一个解,Ax=b有唯一解。
6.向量的导数
设 A 为
m∗n 的矩阵, x 为n∗1 的列向量,则 Ax 为 m∗1 的列向量,记作 y⃗ =A⋅x⃗ 。这里的 y⃗ 跟 x⃗ 是线性相关的。在机器学习里的线性回归中,会用到这个公式。例如矩阵A为:
A=⎧⎩⎨⎪⎪⎪⎪⎪⎪a11a21⋯am1a12a22⋯am2⋯⋯⋯⋯a1na2n⋯amn⎫⎭⎬⎪⎪⎪⎪⎪⎪向量 x⃗ 为:
x⃗ =⎛⎝⎜⎜⎜x1x2⋯xn⎞⎠⎟⎟⎟那么 y⃗ =Ax⃗ 为:
y⃗ =⎛⎝⎜⎜⎜a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxn⋯am1x1+am2x2+⋯+amnxn⎞⎠⎟⎟⎟如果将 A 看做多个样本,行
a11、a12、a1n 等看做各个特征, x⃗ 是各个特征的权重系数,那么 y⃗ 就是一个样本各个特征的加权和。对函数 y⃗ =A⋅x⃗ 求导结果就是:
∂y⃗ ∂x⃗ =∂Ax⃗ ∂x⃗ =⎧⎩⎨⎪⎪⎪⎪⎪⎪a11a12⋯a1na21a22⋯a2n⋯⋯⋯⋯am1am2⋯amn⎫⎭⎬⎪⎪⎪⎪⎪⎪=AT
这个结果其实就是 A 的转置AT 。-
总结结论
-
向量的偏导公式:
(1) 对 x⃗ 求 Ax⃗ 的偏导,结果是 A 的转置 。∂Ax⃗ ∂x⃗ =AT
(2)对 x⃗ 的转置求 Ax⃗ 偏导,结果是 A 本身。∂Ax⃗ ∂x⃗ T=A
(3) 对 x⃗ 求 x⃗ TA 的偏导,结果是 A 。∂(x⃗ TA)∂x⃗ =A
标量对向量的导数
-
如果
A
为
n∗n 的矩阵, x 为n∗1 的列向量,记作 y=x⃗ T⋅A⋅x⃗
可得:∂y∂x⃗ =∂(x⃗ T⋅A⋅x⃗ )∂x⃗ =(AT+A)⋅x⃗
若 A 为对称矩阵,则有∂(x⃗ TAx⃗ )∂x⃗ =2Ax⃗
标量对方阵的导数
-
如果
A
为
n∗n 的矩阵, |A| 为 A 的行列式,计算∂|A|∂A 。
∂|A|∂A=(A∗)T=|A|⋅(A−1)T