一: 矩阵(matrix)的定义
矩阵的一般表达式,如3X3的矩阵:
M =
[
m
11
m
12
m
13
m
21
m
22
m
23
m
31
m
32
m
33
]
\left[ \begin{matrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \end{matrix} \right]
⎣
⎡m11m21m31m12m22m32m13m23m33⎦
⎤
上述的表达式用的是方括号包围,也可以用圆括号和花括号来表示,都是等价的。
前面讲的矢量其实就是一个数组,而矩阵也是一个数组。
矢量可以看成是nX1的列矩阵 或 1Xn的行矩阵。 这样就可以让矢量像一个矩阵一样一起参与矩阵运算,这在空间变换中非常有用。
例如,矢量 v= (1, 2, 3) 可以写成列矩阵:
[
1
2
3
]
\left[ \begin{matrix} 1 \\ 2 \\ 3 \end{matrix} \right]
⎣
⎡123⎦
⎤, 或行矩阵
[
1
2
3
]
\left[ \begin{matrix} 1 & 2 & 3 \end{matrix} \right]
[123] 。
二: 矩阵运算
1. 矩阵和标量的乘法
矩阵的每个元素和该标量相乘。
kM = Mk = k
[
m
11
m
12
m
13
m
21
m
22
m
23
m
31
m
32
m
33
]
\left[ \begin{matrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \end{matrix} \right]
⎣
⎡m11m21m31m12m22m32m13m23m33⎦
⎤ =
[
k
m
11
k
m
12
k
m
13
k
m
21
k
m
22
k
m
23
k
m
31
k
m
32
k
m
33
]
\left[ \begin{matrix} km_{11} & km_{12} & km_{13} \\ km_{21} & km_{22} & km_{23} \\ km_{31} & km_{32} & km_{33} \end{matrix} \right]
⎣
⎡km11km21km31km12km22km32km13km23km33⎦
⎤
2. 矩阵和矩阵的乘法
矩阵和矩阵的乘法必须满足一下规定,不然就无法相乘:第一个矩阵的列数和第二个矩阵的行数相同,它
们相乘得到的矩阵的行数是第一个矩阵的行数,而列数是第二个矩阵的列数。
一个rXn的矩阵A和一个nXc的矩阵B,它们相乘会得到一个rXc的矩阵C = AB
C中的每一个元素
C
i
j
C_{ij}
Cij 等于A的第i行对应的矢量 和 B的第j列对应的矢量进行矢量点乘的结果:
c
i
j
c_{ij}
cij =
a
i
1
b
1
j
a_{i1}b_{1j}
ai1b1j +
a
i
2
b
2
j
a_{i2}b_{2j}
ai2b2j + ··· +
a
i
n
b
n
j
a_{in}b_{nj}
ainbnj =
∑
k
=
1
n
a
i
k
b
k
j
\sum\limits_{k = 1}^n{a_{ik}b_{kj}}
k=1∑naikbkj
矩阵乘法的一些性质:
1. 性质一:矩阵乘法并不满足交换律:AB
≠
\neq
= BA
2. 性质二:矩阵乘法满足结合律: (AB)C = A(BC)
三: 特殊的矩阵
1. 方块矩阵
方块矩阵(square matrix)简称方阵,指行数和列数相等的矩阵。在三维渲染中,最常用的就是3X3和4X4的方阵。
对角元素(diagonal elements),方阵的对角元素指的是行号和列号相等的元素,如
m
11
m_{11}
m11,
m
22
m_{22}
m22等。
对角矩阵(diagonal matrix),除了对角元素外的所有元素都为0。如:
[
1
0
0
0
0
2
0
0
0
0
3
0
0
0
0
4
]
\left [ \begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 3 & 0 \\ 0 & 0 & 0 & 4 \end{matrix} \right]
⎣
⎡1000020000300004⎦
⎤
2. 单位矩阵
单位矩阵(identity matrix), 是一个特殊的对角矩阵。用
I
n
I_{n}
In来表示,如:
I
n
I_{n}
In =
[
1
0
0
0
1
0
0
0
1
]
\left [ \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix} \right]
⎣
⎡100010001⎦
⎤
任何矩阵和它相乘的结果还是原来的矩阵:MI = IM = M
3. 转置矩阵
转置矩阵(transposed matrix), 是对原矩阵的一种运算,即转置运算。
一个rXc的矩阵M,它的转置可以表示成一个cXr的矩阵
M
T
M^{T}
MT
转置矩阵的计算非常简单,只需把原矩阵翻转一下即可:
M
i
j
T
M^{T}_{ij}
MijT =
M
j
i
M_{ji}
Mji
示例:
[
1
2
3
4
5
6
7
8
]
T
\left [\begin{matrix} 1 & 2 & 3 & 4 \\ 5 & 6 & 7 & 8 \end{matrix} \right]^{T}
[15263748]T =
[
1
5
2
6
3
7
4
8
]
\left [ \begin{matrix} 1 & 5 \\ 2 & 6 \\ 3 & 7 \\ 4 & 8 \end{matrix} \right]
⎣
⎡12345678⎦
⎤
我们可以使用转置操作来转换行矩阵和列矩阵。
转置矩阵的一些常用性质:
1. 性质一: 矩阵转置的转置等于原矩阵,
(
M
T
)
T
(M^{T})^{T}
(MT)T = M
2. 性质二:矩阵串接的转置等于反向串接各个矩阵的转置,
(
A
B
)
T
(AB)^{T}
(AB)T =
B
T
A
T
B^{T}A^{T}
BTAT
4. 逆矩阵
逆矩阵的前提:必须是一个方阵。
一个方阵M,它的逆矩阵用
M
−
1
M^{-1}
M−1来表示。
逆矩阵最重要的性质就是,把M和 M − 1 M^{-1} M−1相乘,结果会是一个单位矩阵。即,M M − 1 M^{-1} M−1 = M − 1 M^{-1} M−1M = I
并非所有的方阵都有对应的逆矩阵,例如,一个所有元素都为0的矩阵,任何矩阵和它相乘都会得到一个零矩阵,即所有元素都为零。
如果一个矩阵有对应的逆矩阵,那么这个矩阵就是可逆的(invertible)或者说是非奇异的(nonsingular);
相反,如果一个矩阵没有对应的逆矩阵,那么这个矩阵就是不可逆的(noninvertible)或者说是奇异的(singular)。
如何判断一个矩阵是否是可逆的?
简单来说,如果一个矩阵的行列式(determinant)不为0,那么它就是可逆的。
我们通常可以通过调用第三方库(如C++数学库Eigen)来直接求得这些矩阵。
逆矩阵的一些重要性质:
1. 性质一:逆矩阵的逆矩阵是原矩阵本身。
(
M
−
1
)
−
1
(M^{-1})^{-1}
(M−1)−1 = M
2. 性质二:单位矩阵的逆矩阵是它本身。
I
−
1
I^{-1}
I−1 = I
3. 性质三:转置矩阵的逆矩阵是逆矩阵的转置,
(
M
T
)
−
1
(M^{T})^{-1}
(MT)−1 =
(
M
−
1
)
T
(M^{-1})^{T}
(M−1)T
4. 性质四:矩阵串接相乘后的逆矩阵等于反向串接各个矩阵的逆矩阵。
(
A
B
)
−
1
(AB)^{-1}
(AB)−1 =
B
−
1
A
−
1
B^{-1}A^{-1}
B−1A−1
逆矩阵的几何意义:
一个矩阵可以表示一个变换,而逆矩阵允许我们还原这个变换,或者说是计算这个变换的反向变换。
M
−
1
(
M
v
)
M^{-1}(Mv)
M−1(Mv) =
(
M
−
1
M
)
(M^{-1}M)
(M−1M)v = Iv = v
5. 正交矩阵(orthogonal matrix)
正交是矩阵的一种属性。如果一个方阵M和它的转置矩阵的乘积是单位矩阵的话,我们就说这个矩阵是正交的。 M M T MM^{T} MMT = M T M M^{T}M MTM = I
上面的公式和前面讲的逆矩阵的公式很像:M M − 1 M^{-1} M−1 = M − 1 M^{-1} M−1M = I
由此得到一个重要的性质:如果一个矩阵是正交的,那么它的转置矩阵和逆矩阵是一样的,即 M T M^{T} MT = M − 1 M^{-1} M−1
在三维变换中我们经常需要使用逆矩阵来求解反向的变换。然而逆矩阵的求解往往计算量很大,但转置矩阵却非常容易求得,我们只需把矩阵翻转一下就可以了。
那么,如何判断一个矩阵是正交矩阵呢?
下面是3X3正交矩阵,根据正交矩阵的定义,如下:
M
T
M
M^{T}M
MTM =
[
−
c
1
−
−
c
2
−
−
c
3
−
]
\left [ \begin{matrix} - & c_{1} & - \\ - & c_{2} & - \\ - & c_{3} & - \end{matrix} \right]
⎣
⎡−−−c1c2c3−−−⎦
⎤
[
−
−
−
c
1
c
2
c
3
−
−
−
]
\left [ \begin{matrix} - & - & - \\ c_{1} & c_{2} & c_{3} \\ - & - & - \end{matrix} \right]
⎣
⎡−c1−−c2−−c3−⎦
⎤
=
[
c
1
c
1
c
1
c
2
c
1
c
3
c
2
c
1
c
2
c
2
c
2
c
3
c
3
c
1
c
3
c
2
c
3
c
3
]
\left [ \begin{matrix} c_{1}c_{1} & c_{1}c_{2} & c_{1}c_{3} \\ c_{2}c_{1} & c_{2}c_{2} & c_{2}c_{3} \\ c_{3}c_{1} & c_{3}c_{2} & c_{3}c_{3} \end{matrix} \right]
⎣
⎡c1c1c2c1c3c1c1c2c2c2c3c2c1c3c2c3c3c3⎦
⎤
=
[
1
0
0
0
1
0
0
0
1
]
\left [ \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix} \right]
⎣
⎡100010001⎦
⎤ = I
通过上述得出结论:
- 矩阵的每一行,即 c 1 c_{1} c1、 c 2 c_{2} c2、 c 3 c_{3} c3是单位矢量,只有这样它们与自己的点积才能是1。
- 矩阵的每一行,即 c 1 c_{1} c1、 c 2 c_{2} c2、 c 3 c_{3} c3之间相互垂直,只有这样它们之间的点积才能是0。
- 上述的两条结论对矩阵的每一列同样适用,因为如果M是正交矩阵,那么 M T M^{T} MT也会是正交矩阵。
一组标准正交基可以精确的满足上述条件。
在三维笛卡尔坐标系中,三个坐标轴之间相互垂直,我们称这样的基矢量为正交基(orthogonal basis)。如果它们的长度都是1的话,我们称它们是一组标准正交基(orthonormal basis)。
所以,一个正交矩阵的行和列之间分别构成了一组标准正交基。
四: 使用行矩阵还是列矩阵
在和矩阵相乘时选择行矩阵还是列矩阵来表示矢量是非常重要的,因为这决定了矩阵乘法的书写次序和结果值。
在Unity中,常规做法是把矢量放在矩阵的右侧,即把矢量转换成列矩阵来进行运算。
这意味着,矩阵乘法通常是右乘:CBAv = (C(B(Av)))
我们的阅读顺序是从右到左。
等价于:
v
A
T
B
T
C
T
vA^{T}B^{T}C^{T}
vATBTCT =
(
(
(
v
A
T
)
B
T
)
C
T
)
(((vA^{T})B^{T})C^{T})
(((vAT)BT)CT)