用4种不同视角理解矩阵乘法

目录

1. 背景

2. 线性方程组视角(向量点积视角)

3. 列向量观点视角

4. 向量变换视角(矩阵函数)

5. 坐标变换视角


1. 背景

        矩阵诞生于线性方程组的求解,最基本的运算方法来自于高斯消元法,所以矩阵整个运算规则都符合高斯消元法,矩阵源于线性方程组但经过几十年的发展已不限于求解线性方程组,可用于很多应用场景,线性方程组如下所示:

a_{11}x_1+a_{12}x_2+···+a_{1n}x_n=y_1\\ a_{21}x_1+a_{22}x_2+···+a_{2n}x_n=y_2\\ ···\\ a_{m1}x_1+a_{m2}x_2+···+a_{mn}x_n=y_m

2. 线性方程组视角(向量点积视角)

        将线性方程组直接写成向量形式,如下所示:

\begin{pmatrix} a_{11}x_1 + a_{12}x_2 + ··· + a_{1n}x_n\\ a_{21}x_1 + a_{22}x_2 + ··· + a_{2n}x_n\\ ···\\ a_{m1}x_1+a_{m2}x_2+···+a_{mn}x_n \\ \end{pmatrix}= \begin{pmatrix} y_1\\ y_2\\ ···\\ y_m \end{pmatrix}

        可以认为是矩阵的行向量与向量x的点积(矩阵的行乘以向量的列),如下:

\begin{pmatrix} a_{11}&a_{12}&···&a_{1n}\\ a_{21}&a_{22}&···&a_{2n}\\ ···\\ a_{m1}&a_{m2}&···&a_{mn} \\ \end{pmatrix} \begin{pmatrix} x_1\\x_2\\···\\x_n \end{pmatrix}= \begin{pmatrix} y_1\\ y_2\\ ···\\ y_m \end{pmatrix}

3. 列向量观点视角

        对于Ax=y

\begin{pmatrix} a_{11}x_1 + a_{12}x_2 + ··· + a_{1n}x_n\\ a_{21}x_1 + a_{22}x_2 + ··· + a_{2n}x_n\\ ···\\ a_{m1}x_1+a_{m2}x_2+···+a_{mn}x_n \\ \end{pmatrix}= \begin{pmatrix} y_1\\ y_2\\ ···\\ y_m \end{pmatrix}

        可以分解成:

\begin{pmatrix} a_{11}\\ a_{21}\\ ···\\ a_{m1}\\ \end{pmatrix}x_1+\begin{pmatrix} a_{12}\\ a_{22}\\ ···\\ a_{m2}\\ \end{pmatrix}x_2+\begin{pmatrix} ···\\ ···\\ ···\\ ···\\ \end{pmatrix}x_{...}+\begin{pmatrix} a_{1n}\\ a_{2n}\\ ···\\ a_{mn}\\ \end{pmatrix}x_n = \begin{pmatrix} y_1\\ y_2\\ ···\\ y_m \end{pmatrix}

        上述就表示向量y是否能由向量a线性组合得到,只要向量y位于向量a张成的向量空间内,那么向量y一定能由向量a线性组合得到,即一定能找到一组x使得上式必然成立。

4. 向量变换视角(矩阵函数)

        对于Ax=y,在矩阵作用向量x经过拉伸、旋转操作变成了向量y,写成函数形式如下:

f(x)=Ax

        矩阵乘法𝐴𝑥 可以理解为矩阵A 作为一个线性变换函数,将输入向量𝑥映射到一个新的向量 𝐴𝑥, 对于一个 m×n 的矩阵 A,定义域是所有 n维向量的集合,即\mathbb{R}^n;而值域可以从矩阵乘法的列观点视角,那么值域\mathbb{R}^m

        通过矩阵函数可研究在矩阵作用下,可研究定义域与值域的映射关系,如A是一个m*n的矩阵,x是一个n维向量,那么值域可认为是由A的n个列向量张成的空间,张成的空间的维数等于列向量组的秩(小于等于n),即值域的维数一定是小于等于定义域的维数。通过函数视角可研究在矩阵A有什么特征下定义域x与值域y的关系(满射特性/单射特性)。

5. 坐标变换视角

        对于同一个向量在不同基(即为不同坐标系)下有不同的坐标值,虽然坐标值不同但可以表达同一向量,即它们的方向和长度一样,对于矩阵向量的乘法可以认为是同一个向量在不同的坐标系的的表达,当然就可以从正向变换与逆向变换两个角度去理解矩阵乘法。

        对于Ax=y可以有两个坐标变换的视角,一个视角是向量x自然基坐标,另外一个是非自然基坐标。对于向量x为非自然基坐标,向量y为自然基坐标,向量x可以理解为以矩阵A的列向量为基的非自然坐标系坐标,那个Ax运算即为将向量x转换到到自然系的向量y的坐标

Ax=\begin{pmatrix} a_{11}\\ a_{21}\\ ···\\ a_{m1}\\ \end{pmatrix}x_1+\begin{pmatrix} a_{12}\\ a_{22}\\ ···\\ a_{m2}\\ \end{pmatrix}x_2+\begin{pmatrix} ···\\ ···\\ ···\\ ···\\ \end{pmatrix}x_{...}+\begin{pmatrix} a_{1n}\\ a_{2n}\\ ···\\ a_{mn}\\ \end{pmatrix}x_n

        坐标变换的另外一个角度是认为x是自然基坐标系,即:

x=\begin{pmatrix}x_1 \\x2\\···\\x_n\end{pmatrix}= E*\begin{pmatrix}x_1 \\x2\\···\\x_n\end{pmatrix}= x_1\begin{pmatrix}1\\0\\···\\0\end{pmatrix}+ x_2\begin{pmatrix}0\\1\\···\\0\end{pmatrix}+ ···+ x_n\begin{pmatrix}0\\0\\···\\1\end{pmatrix}\\ \ \\=x_1e_1+x_2e_2+···+x_3e_3

        从Ax视角观察并不直观观察到坐标变换规律,可以将其做一个简单的变形:

Ax=y\ \rightarrow \ x=A^{-1}y

        上式中x是自然基坐标系,y是非自然基坐标系,Ax就将自然基坐标转换成以A^{-1}的列向量为基坐标系的坐标。

        矩阵向量乘法Ax=y,一定情况下可以认为向量x与向量y为同一向量,仅仅是坐标系不一样,这里“一定情况下”这里是指A为满秩矩阵,但A非满秩矩阵就可能降维情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值