我不想写formalized proof,我打算从一个例子来说明这个东西,我也看了前面的答案,写的不是太好,虽然也没多少人关注这个问题就是了,就当自己写笔记吧,要说明这个东西你先的真的对矩阵乘法的有一些几何上的理解才比较好办,矩阵乘法可以从不同的view产生不同的理解,(顺带一句我认为 这种理解是最low的,理解止于这一步就让linear algebra彻底沦为算术了,这是非常反人类的),回答这个问题之前,我先介绍两种对矩阵乘法的理解
有矩阵AB=C为
column view
对于矩阵运算AB=C,可以把B看作n列独立的column vector放在了一起(例如B是 和
两个向量放在同一个地方 ),而AB就是表示A矩阵分别和B的每一列column vector相乘的结果,也就是cols(C)[1]=A*cols(B)[1],cols(C)[2] = A*cols(B)[2],计算过程如下
从这里可以很直接看出B其实就是一堆(向量)映射的集合,矩阵乘向量就可以看成矩阵列的linear combination
row view
或者其实可以从row的视角去看,其实矩阵乘法就是A中各个row vector和B矩阵的的乘,也就是C=AB其实就是, rows(C)[1] = rows(A)[1]B,rows(C)[2] = rows(A)[2]B,rows(C)[3] = rows(A)[3]*B
所以矩阵乘法就是第一个矩阵和第二个矩阵的每一个列向量分别做乘法然后组合成结果(形状变化为(m x n)*(n x 1) = m x 1),或者第一个矩阵的每一个行向量和第二个矩阵做乘法(形状变化为(1 x n)*(n x p) = 1 x p)