向量、矩阵的基本意义

最新推荐文章于 2024-09-15 00:00:00 发布

凌晗

最新推荐文章于 2024-09-15 00:00:00 发布

阅读量5k

点赞数

分类专栏：矩阵论文章标签：矩阵

本文链接：https://blog.csdn.net/zzh975886259/article/details/101564897

版权

矩阵论专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. 矩阵乘以向量：Ma=b

1.0 矩阵可以看做向量变换的一种表示("动词")——矩阵M乘以向量a表示对向量a施加向量变换M，使向量a变换成一个新的向量b，二者是同一坐标系下的不同客观向量

1.1 矩阵可以看做向量“垂直投影+缩放”的一种表示——矩阵M乘以向量a表示将向量垂直投影到坐标系M上（M的两行是两个投影轴）并缩放该投影轴长度倍，得到的结果为b。特殊的，当M每行都是单位向量时（比如M是正交矩阵），即相当于将a投影到坐标系M上，投影结果即为b（此时缩放倍数为1 ，相当于不缩放）。

1.2 矩阵可以看做坐标系的一个声明("形容词”）——Ma表示向量a定义在坐标系M下（M的两列是两个坐标轴），即矩阵M相当于向量a的坐标系声明。（同理b=Ib表示b定义在坐标系I下，Ma=b的等号表示定义在坐标系M上的a和定义在坐标系I上的b在基准坐标系下表示同一客观向量）。

1.3 矩阵可以看做向量形式不变下的基变换的一种表示——把Ma看成MIa，也可以说对基I施加变换M，变成了基M，向量形式还是a，但此时基M下的a，不再等价于基准坐标系（I）下的客观向量a，而是等价于基准坐标系下的b，即客观向量a和客观向量b只是在不同坐标系下具有相同表现形式——客观向量a在I坐标系下表现为a，客观向量b在M坐标系下也表现为a。

1.4 矩阵可以看作客观向量不变下的基变换的一种表示——Ma=b，即a=M-1b,表示将客观向量a放到新的坐标系M-1中，得到的坐标是b，即M可以表示在客观向量不变的情况下进行基变换。变换后，M-1坐标系下的向量形式b只是基准坐标系下的客观向量a的在另一个坐标系下的另一种表示，二者本质是同一个客观向量。常见的M一般为正交基，此时基变换后，在以M的列向量为基的坐标系中，新坐标值相当于将客观向量投影到M的两个行向量上的投影值。

2. 矩阵乘以矩阵：MN=P

2.1 矩阵M、N都看做变换——矩阵M乘以矩阵N表示，将M和N表示的变换复合成一个新的变换P，即施加P的变换效果等价于先施加M变换，再施加N变换

2.2 矩阵看作投影，矩阵N看作向量组（这里假设M是正交基，N的一列一个样本）——矩阵M乘以N表示将原始向量组从原始基I变换到M基（M的各行是基），即相应的将各样本N投影到M基上得到新的样本表示P

2.3 矩阵M看做变换，矩阵N看做坐标系——矩阵M乘以矩阵N表示，对坐标系N施加变换，得到新的坐标系P，

2.4 矩阵M、N都看作坐标系——矩阵M乘以矩阵N表示，在坐标系M下度量坐标系N，即矩阵M相当于坐标系N的度量（坐标系）声明

解释：

1.1：这里可以把M写成分块矩阵[m1;m2]，而b=[b1;b2]，则由Ma=b可得，b1=<m1,a>, b2=<m2,a>，尖括号表示内积。又b1=<m1,a>=|m1|*Proj_m1(a)，即内积表示投影后再缩放，b2同理。所以说，矩阵可以表示对向量先投影再缩放。特殊的，当M每行，即m1和m2，都是单位向量时，由于a与单位向量的内积就等于在其上面的投影，所以此时相当于只有投影。

1.2：这里可以把M写成分块矩阵[m1,m2]; 而a=[a1,a2]T. 则Ma = a1*m1+a2*m2,回想一下我们解析几何里面的(x,y)=x*e_x+y*e_y, 是不是很类似呢？类比下也就是说，Ma就表示在m1和m2为基下空间里的一个向量，这个向量在两个轴上分别是a1个单位和a2个单位（即客观向量在M坐标系的m1和m2轴上的投影分别是a1和a2），我们可以直接用a作为M坐标系下客观向量的表示，但是需要声明是在M坐标系下，即写成Ma形式。所以说Ma表示定义在M坐标系下的向量a（他等于价于定义在I下的b，即二者在基准坐标系下都是同一个向量）

1.3：矩阵可以对向量施加变换，也可以对基施加变换，二者是相对的，结合1.2可以理解，对基I施加变换M后相当于对原有向量形式a指定了新的基MI=M，此时得到的Ma实际上对应基准坐标系下的b，而不是原来的基准坐标系下的a了，即通过改变基而不改变向量形式来使得客观向量发生变换。

1.4：直观解释不太方便，我们反向来推。假设我们将一个P坐标系下的向量a，放在Q坐标系下表示，表示结果为向量b，由1.2可知，由于二者本质是同一客观向量，则应该满足Pa=Qb。若令P=I，Q=M-1则表示，我们要将基准坐标系I下的向量a表示为坐标系M-1下的向量形式b，对应a=M-1b，也就是Ma=b。另一方面，如果我们令P=M，Q=I，则表示我们要将坐标系M下的a表示为基准坐标系下I的b，同样对应Ma=b，即是相当于1.3的另一种解释。可见，这种以1.2为依据的解释方法是具有普适性的。

辨析1.1，1.3和1.2，1.4：1.1中是坐标系不变，对a施加M变换，结果是a变成另一个向量b，即二者实际上是同一坐标系下的不同客观向量的不同表示。1.3而1.2（静态解释）中是对a声明处于坐标系M下，它对应于处于坐标系I下的b，即实际上二者在基准坐标系中是同一客观向量。1.3中，则是将a投影到新的坐标系M（单位基）得到新的向量b，即实际上原基准坐标系中的a和M坐标系中的b仍是同一客观向量在不同坐标系下的表示。（若M不是单位基，则投影后又有缩放，也就不是原客观向量了）

辨析1.2-1.3：1.2和1.3是两个不同的理解思路。1.2是一种静态的观点，即分别看Ma和b，二者都是一个客观向量在某个坐标系下的一种表示形式，当二者所表示的向量对应的是（基准坐标系下的）同一个客观向量，它们就划上了等号。1.3是一种动态的观点，即整体看Ma=b，是表示对a执行某种操作得到了b，这里的操作就是投影。注意：1.2里面说的投影是指，a（a1和a2）是客观向量在M坐标系下的投影，所以可以用a作为客观向量在M坐标系下一种表示（但是要注明M，就有了Ma这种形式）。而1.3里面说的投影是指，b（b1和b2）是（客观）向量a在M投影系下的投影结果。虽然都有a，都是在M上的投影，但是1.2中的a是"客观向量x在M坐标系的投影结果"，即a只是客观向量在M坐标系下一种表现形式（分身），投影的主体是客观向量，而1.3中的则a可以看作"客观向量本身"，我们就是把a投影到M上，a就是投影主体，投影结果是b。

辨析1.0-1.4：先给一个结论：向量在正交基上的垂直投影值即为该向量在该正交基下的坐标值。（因为确定坐标的本质方法是矢量加法——平行四边形法则，当基是正交基时，投影法刚好等同于矢量加法，二者都变成了“矩形法则”，这一结论可以扩展到基为相互垂直的向量，不需要是单位向量）。。令M=[m1；m2]，b=[b1；b2]，且M是正交基，则M-1=MT=[m1'，m2']。由1.0，行向量m1'和m2’为单位向量的矩阵M乘以向量a等于b，表示将向量a投影到M的两个行向量上，结果为b。由上述结论——“向量在正交基上的投影，即为该向量在该正交基下的坐标”，此时也就是表示b为向量a在新的基m1'和m2’下的坐标。由1.4，矩阵M乘以向量a表示客观向量不变的条件下的基变换（或者说向量"分身"），即基由原始基I转化为M-1=[m1'，m2']，相应的向量形式分身（变换）为b，也同样就是说此时向量a在新的基m1'和m2’下的坐标为b。所以，1.0和1.4两种解释在正交基M上得到统一。

关于"客观向量"和“向量形式”这一说法：我们知道，客观物体的存在不依赖于坐标系，我们生活的三维空间里没有画坐标轴，但是物体还是客观存在的。坐标轴的作用只是可以让我们将客观存在的物体表示出来，而且不同坐标系下物体一般具有不同表示，我们一般将这些表示称为向量。可以说，客观向量就是客观存在的物体，坐标系就是"放在某个角度的照相机"，而该坐标系下的向量形式（简称向量）就是"某个角度的照片"（客观物体的一种像）。没有照相机，你还是你，而有了照相机就可以把你照（表示）出来，而且不同角度的照相机一般照出来的（表示出来的）结果还一般不一样，但是可以相互转换（比如不同视角的照片通过仿射变换可以互相转换）。那么我们想要去研究比较这些照片（物体的一种表现形式）和照相机（坐标系）的时候（比如需要确定两张照片是不是来自同一个物体——客观向量），因为照片（向量）来自不同角度的照相机（坐标系），不能直接比较出来，所以我们需要转换到一个共同的角度（参考系）下比较，而我们一般习惯选择的角度就是正面（基准参考系I）。所以比较两个不太角度照片是不是来自同一个物体（两个向量是不是来自同一个客观向量）时，我们只需要拿起两张照片观察一下，我们的大脑会通过想象将它们都转换到正面的样子（基准坐标系）下，此时在相同参考系下，相等就是说明为同一物体（同一客观向量）。需要注意的是，我们要将物体（客观向量）量化描述为它的一个表现形式（向量）时必须需要一个坐标系，我们默认选择的坐标系就是标准正交基（因为它符合我们对抽象的1的概念），也就是说我们平时单独写的向量或者矩阵，除非像1.2那样"声明"，向量或者矩阵里面的数字都默认是以标准正交基为单位长度的度量结果，一般我们把标准正交基作为我们心里的标尺，所以一般也把它的度量结果当做"实际长度"。

2.2：

2.3：

1也可以结合2来解释，即将Ma写成MIa

用2.1解释：矩阵I施加的变换是”不变“，复合上M的变换，结果就是相当于只施加M变换

用2.3解释：a原来的坐标系是I，对其坐标系进行变换，得到新的坐标系MI=M，即现在Ma不再是坐标系I下的向量表示，而是坐标系M下的向量表示，而且它等价于基准坐标系（I）中的b（比如a=[1;1], 原来是I坐标系下的向量表示，乘以了M=[2,0 ;0,2]后，a变成M坐标系下的表示Ma，虽然在两个轴上仍然是1个单位长度，但是因为这个单位长度的度量变了（变为2倍），所以它实际是等于基准坐标系下的[2;2]，就是b）。

用2.4解释：a原本是在坐标系I下的度量结果，乘以M后，MI表示坐标系又I是在在坐标系M下的度量结果，所以就说a是在MI=M下的度量结果