机器学习数学基础（三）：线性代数矩阵

最新推荐文章于 2024-05-17 19:58:04 发布

VIP文章 '仰望星空,脚踏实地'-菱

最新推荐文章于 2024-05-17 19:58:04 发布

阅读量689

点赞数

分类专栏：机器学习基础文章标签：线性代数机器学习

本文链接：https://blog.csdn.net/weixin_44365744/article/details/104471778

版权

机器学习数学基础（三）

（一）矩阵
（二）特征值和特征向量
（三）矩阵求导

（一）矩阵

引例SVD

什么是SVD？

奇异值分解（Singular Value Decomposition）是一种重要的矩阵分解方法，可以看作对称方阵在任意矩阵上的推广。
在这里插入图片描述
与特征值、特征向量概念相对应：

$\sum_{}$ 对角线上的元素称为矩阵A的奇异值
U 的第i列称为A的关于 $\sigma_i$ 的左奇异向量
V 的第i列称为A的关于 $\sigma_i$ 的右奇异向量

举例

已知 $\times 5$ 阶实矩阵A，求A的SVD分解：
一个图像也可以看作一个矩阵，进行分解

基础概念

定义

线性代数定义：方阵行列式

1阶方阵行列式是该元素本身
n阶方阵行列式等于它任一行/列各元素与其对应的代数余子式乘积之和

代数余子式

余子式
在一个n阶行列式A中，把（i，j）元素 $a_ij$ 所在的第i行和第j列划去后，留下的n-1阶方阵的行列式叫做元素 $a_ij$ 的余子式，记作 $M_ij$
代数余子式
代数余子式 $A_ij$ = $1)^{i+j}$ $M_ij$

伴随矩阵

对于 $\times n$ 方阵的任意元素 $a_ij$ 都有各自的代数余子式 $A_ij$ = $1)^{i+j}$ $M_ij$ ，
构造 $\times n$ 的方阵 $A^*$ ：
在这里插入图片描述
$A^*$ 是A的伴随矩阵
$A_ij$ 位于 $A^*$ 的第j行第i列

方阵的逆

$A\cdot A^*=|A|\cdot I$
推导过程如下：
在这里插入图片描述

范德蒙行列式

证明范德蒙行列式，使用数学归纳法
在这里插入图片描述

矩阵的乘法/状态转移矩阵

矩阵乘法

A为 $\times s$ 阶矩阵，B为 $\times n$ 阶矩阵，那么，C= $\times B$ 阶矩阵是 $\times n$ 阶矩阵，其中
在这里插入图片描述

矩阵和向量乘法

A为 $\times n$ 阶矩阵，B为 $\times 1$ 阶矩阵，则 $A x$ 为 $\times 1$ 列向量，记为 $\overrightarrow{y} = A\cdot$ $\overrightarrow{x}$
由于n维列向量和n维空间的点一一对应，上式也是从n维空间的点到m维空间点的线性变换（旋转、平移）。
特殊的，若m=n，Ax完成的是n维空间内的线性变换。

应用：机械手臂移动

状态转移矩阵

状态转义概率
某随机过程，状态有n个，用1—n表示。记在当前时刻t时位于i状态，再t+1时刻位于j状态的概率为P（i，j）= P（j | i），即状态转移概率只依赖于前一个状态。
概率转移矩阵
第n+1代中处于第j个阶层的概率为：

此式中矩阵P为（条件）概率转移矩阵。第i行元素表示，在上一个状态为i时的分布概率，即：每一行元素和为1。
平稳分布
转移概率矩阵性质是初始概率不同，经过若干次迭代，最终稳定收敛在某个分布上，称为平稳分布，这个性质不是初始分布的性质。
以下两种写法等价：

如果概率分布 $\pi P = \pi$ ，说明：
（1）该多项分布是状态转移矩阵P的平稳分布；
（2）线性方程xP = x的非负解为 $\pi$ ，而 $P^n$ 唯一，因此 $\pi$ 是线性方程xP = x的唯一非负解

矩阵和向量组

矩阵的秩

设在矩阵A中有一个不等于零的r阶子式D，且所有r+1阶子式（若存在）为0，那么D为矩阵A的最高阶非零子式，r称为矩阵A的秩，记为 $R (A) = r$ 。

$\times n$ 的可逆矩阵，秩为n
可逆矩阵又称满秩矩阵
矩阵的秩等于它行（列）向量组的秩

秩和线性方程组解的关系

在这里插入图片描述
对于n元线性方程组 $A x = b$

无解的充要条件是 $R (A) < R (A, b)$
有唯一解的充要条件是 $R (A) = R (A, b) = n$
有无限多解的充要条件是 $R (A) = R (A, b) < n$
推论
$A x = 0$ 有非零解的充要条件是 $R (A) < n$
$A x = b$ 有解的充要条件是 $R (A) = R (A, b)$

向量组等价

什么是向量组等价
向量 $\overrightarrow{b}$ 能由向量组A： $\overrightarrow{a_1}$ , $\overrightarrow{a_2}$ ,… $\overrightarrow{a_m}$ 线性表出的充要条件是矩阵A=( $\overrightarrow{a_1}$ , $\overrightarrow{a_2}$ ,… $\overrightarrow{a_m}$ ）的秩等于矩阵B=( $\overrightarrow{a_1}$ , $\overrightarrow{a_2}$ ,… $\overrightarrow{a_m}$ , $\overrightarrow{b}$ )的秩
设有两个向量组A： $\overrightarrow{a_1}$ , $\overrightarrow{a_2}$ ,… $\overrightarrow{a_m}$ 和B： $\overrightarrow{b_1}$ , $\overrightarrow{b_2}$