前言
本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。
现在CSDN不能发超长的文章了,只能分成多篇发布。
人工智能数学基础之线性代数(一)
人工智能数学基础之线性代数(二)
人工智能数学基础之线性代数(三)
标量
只有大小没有方向的量称为标量。
单个数字就是标量。
向量
所谓的向量就是一组数字,可以用
v
v
v来表示
v
=
[
1
2
3
]
v = \left[\begin{matrix}1 \\2 \\3 \end{matrix} \right]
v=
123
或
v
=
[
1
2
3
]
v = [1 ~ 2 ~ 3]
v=[1 2 3]
当两个向量大小相等、方向相同时,说这两个向量相等。
这里由3个数组成,叫做3维向量,相应的,由n个数组成的称为n维向量。
左边排成一列的形式叫做列向量;右边叫做行向量
v i v_i vi表示向量中的第 i i i个元素,本例中 v 1 = 1 , v 2 = 2 , v 3 = 3 v_1 =1,v_2 = 2,v_3 = 3 v1=1,v2=2,v3=3
3维向量可以在3维空间中表示出来。
向量的长度
n维向量 α = ( a 1 , a 2 , . . . , a n ) \alpha = (a_1,a_2,...,a_n) α=(a1,a2,...,an),数值 a 1 2 + a 2 2 + . . . + a n 2 \sqrt{a_1^2 + a_2^2 + ... + a_n^2} a12+a22+...+an2称为向量 α \alpha α的长度或模,记为 ∥ α ∥ \left \| \alpha \right \| ∥α∥
∥ α ∥ = 1 \left \| \alpha \right \| = 1 ∥α∥=1 称 α \alpha α为单位向量。
向量的运算
向量的加法:
向量的减法:
注意 a ⃗ − b ⃗ \vec{a} - \vec{b} a−b得到的向量为 b ⃗ \vec{b} b指向 a ⃗ \vec{a} a。
向量的乘法:
a ⃗ ⋅ b ⃗ = ∣ a ⃗ ∣ ⋅ ∣ b ⃗ ∣ cos θ \vec{a} \cdot \vec{b} = | \vec{a} | \cdot |\vec{b}| \cos \theta a⋅b=∣a∣⋅∣b∣cosθ
相当于向量 b ⃗ \vec{b} b在向量 a ⃗ \vec{a} a的方向的投影与向量 ∣ a ⃗ ∣ | \vec{a} | ∣a∣相乘
向量的范数
向量的1-范数:
∥
X
∥
1
=
∣
x
1
∣
+
∣
x
2
∣
+
.
.
.
+
∣
x
n
∣
\left \| X \right \|_1 = |x_1| +|x_2| + ... + |x_n|
∥X∥1=∣x1∣+∣x2∣+...+∣xn∣ ;各元素的绝对值之和
向量的2-范数:
∥
X
∥
=
x
1
2
+
x
2
2
+
.
.
.
+
x
n
2
\left \| X \right \| = \sqrt{x_1^2 + x_2^2 + ... + x_n^2}
∥X∥=x12+x22+...+xn2 ; 每个元素的平方和再开方,也就是n维向量的长度;
向量的无穷范数:
∥
X
∥
∞
=
max
(
∣
x
1
∣
,
∣
x
2
∣
,
.
.
.
,
∣
x
n
∣
)
\left \| X \right \|_\infty = \max(|x_1|,|x_2|,...,|x_n|)
∥X∥∞=max(∣x1∣,∣x2∣,...,∣xn∣) ;分量绝对值的最大者
向量的p-范数:
∥
X
∥
p
=
(
∑
i
=
1
n
∣
x
i
∣
p
)
1
p
,
(
1
≤
p
≤
n
)
\left \| X \right \|_p = (\sum_{i=1}^n |x_i| ^ p)^{\frac{1}{p}} , (1 \leq p \leq n)
∥X∥p=(∑i=1n∣xi∣p)p1,(1≤p≤n)
对于2-范数有: ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ ≥ ∣ ∣ x + y ∣ ∣ ||x|| + ||y|| \geq || x + y|| ∣∣x∣∣+∣∣y∣∣≥∣∣x+y∣∣
当
∣
∣
x
⃗
∣
∣
||\vec{x}||
∣∣x∣∣ ≠
0
0
0 ,
∣
∣
y
⃗
∣
∣
||\vec{y}||
∣∣y∣∣ ≠
0
0
0 时,称
θ
=
arccos
a
⃗
⋅
y
⃗
∣
∣
x
⃗
∣
∣
∣
∣
y
⃗
∣
∣
\theta = \arccos \frac{ \vec{a} \cdot \vec{y}}{||\vec{x}|| || \vec{y}||}
θ=arccos∣∣x∣∣∣∣y∣∣a⋅y
为向量
x
⃗
\vec{x}
x与
y
⃗
\vec{y}
y的夹角。
向量的内积
设有n维向量
x
⃗
=
[
x
1
x
2
⋮
x
n
]
,
y
⃗
=
[
y
1
y
2
⋮
y
n
]
,
\vec{x} = \left[ \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{matrix} \right], \vec{y} = \left[ \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{matrix} \right],
x=
x1x2⋮xn
,y=
y1y2⋮yn
,
令
[
x
⃗
,
y
⃗
]
=
∑
i
=
1
n
x
i
y
i
=
x
1
y
1
+
x
2
y
2
+
⋯
+
x
n
y
n
[\vec{x},\vec{y}] = \sum_{i=1}^n x_i y_i = x_1y_1 + x_2y_2 + \cdots+ x_ny_n
[x,y]=∑i=1nxiyi=x1y1+x2y2+⋯+xnyn
上式称为向量的内积,内积的结果是一个标量。
这里要求一维向量 x ⃗ \vec{x} x和向量 y ⃗ \vec{y} y的行列数相同。
当 [ x ⃗ , y ⃗ ] = 0 [\vec{x},\vec{y}] = 0 [x,y]=0时,称向量 x ⃗ \vec{x} x和向量 y ⃗ \vec{y} y正交。
一组两两相交的非零向量,称为正交向量组。
向量组
若干个同维的列向量(行向量)所组成的集合称为向量组。
如
a
1
⃗
,
a
2
⃗
,
a
3
⃗
,
⋯
,
a
n
⃗
\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}
a1,a2,a3,⋯,an
[ a 11 a 21 ⋯ a m 1 a 12 a 22 ⋯ a m 2 ⋮ ⋮ ⋱ ⋮ a 1 n a 2 n ⋯ a m n ] \left[ \begin{matrix} a_{11} & a_{21} & \cdots & a_{m1}\\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \end{matrix} \right] a11a12⋮a1na21a22⋮a2n⋯⋯⋱⋯am1am2⋮amn
向量组的线性组合:
对于向量组
a
1
⃗
,
a
2
⃗
,
a
3
⃗
,
⋯
,
a
n
⃗
\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}
a1,a2,a3,⋯,an,如果有一组数
k
1
,
k
2
,
⋯
,
k
n
k_1,k_2,\cdots,k_n
k1,k2,⋯,kn,使
β
⃗
=
k
1
a
1
⃗
+
k
2
a
2
⃗
+
⋯
+
k
n
a
n
⃗
,
\vec{\beta} = k_1 \vec{a_1} + k_2\vec{a_2} + \cdots + k_n\vec{a_n},
β=k1a1+k2a2+⋯+knan,
则称向量
β
⃗
\vec{\beta}
β是向量组
a
1
⃗
,
a
2
⃗
,
a
3
⃗
,
⋯
,
a
n
⃗
\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}
a1,a2,a3,⋯,an的一个线性组合,或称
β
⃗
\vec{\beta}
β可由向量组
a
1
⃗
,
a
2
⃗
,
a
3
⃗
,
⋯
,
a
n
⃗
\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}
a1,a2,a3,⋯,an线性表示。
向量组的线性相关:
给定向量组
A
=
a
1
⃗
,
a
2
⃗
,
a
3
⃗
,
⋯
,
a
n
⃗
A= \vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}
A=a1,a2,a3,⋯,an,如果存在不全为零的数
k
1
,
k
2
,
⋯
,
k
n
k_1,k_2,\cdots,k_n
k1,k2,⋯,kn使
k
1
a
1
⃗
+
k
2
a
2
⃗
+
⋯
+
k
n
a
n
⃗
=
0
k_1\vec{a_1} + k_2\vec{a_2} + \cdots + k_n\vec{a_n} = 0
k1a1+k2a2+⋯+knan=0
则称向量组 A A A是线性相关的,否则称它为线性无关。
对于任一向量组,不是线性无关就是线性相关。
向量空间
设 V V V是 n n n维实向量构成的集合,对于向量的加法运算及数乘运算满足:
- 任意 α ∈ V , β ∈ V \alpha \in V,\beta \in V α∈V,β∈V,有 α + β ∈ V \alpha + \beta \in V α+β∈V;
- 任意 α ∈ V , k ∈ R \alpha \in V, k \in R α∈V,k∈R,有 k α ∈ V k\alpha \in V kα∈V
则称集合 V V V为 R R R上的实向量空间,简称向量空间。
已知 V 1 , V 2 V_1,V_2 V1,V2是向量空间,若 V 1 ∈ V 2 V_1 \in V_2 V1∈V2,则称 V 1 V_1 V1是 V 2 V_2 V2的子空间。
向量集合的张成
定义 令 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn为向量空间 V V V中的向量。 α 1 v 1 + α 2 v 2 + ⋯ + α n v n \alpha_1 v_1 + \alpha_2 v_2 + \cdots + \alpha_n v_n α1v1+α2v2+⋯+αnvn (其中 α 1 , α 2 , ⋯ , α n \alpha_1,\alpha_2,\cdots,\alpha_n α1,α2,⋯,αn为标量)称为向量 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn的线性组合。
向量 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn的所有线性组合构成的集合,称为 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn的张成(Span)。向量 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn的张成记为 Span ( v 1 , v 2 , ⋯ , v n ) \text{Span}(v_1,v_2,\cdots,v_n) Span(v1,v2,⋯,vn)。
向量空间的基
设 V V V是一个向量空间,如果存在一组向量 α 1 , α 2 , ⋯ , α r ∈ V \alpha_1,\alpha_2,\cdots,\alpha_r \in V α1,α2,⋯,αr∈V,满足:
- α 1 , α 2 , ⋯ , α r \alpha_1,\alpha_2,\cdots,\alpha_r α1,α2,⋯,αr线性无关;
- V V V中任意一组向量都可以由该向量组线性表示,则称 α 1 , α 2 , ⋯ , α r \alpha_1,\alpha_2,\cdots,\alpha_r α1,α2,⋯,αr为向量空间 V V V的一组基;
线性无关:如果向量空间 V V V中的向量 v 1 , v 2 , ⋯ , v n v_1,v_2,\cdots,v_n v1,v2,⋯,vn满足
c 1 v 1 + c 2 v 2 + ⋯ + c n v n = 0 c_1 v_1 + c_2 v_2 + \cdots + c_n v_n = 0 c1v1+c2v2+⋯+cnvn=0
就可以推出所有标量 c 1 , ⋯ , c n c_1,\cdots,c_n c1,⋯,cn必为0,则称它们为线性无关的。
标准基
集合 { e 1 , e 2 , e 3 } \{e_1,e_2,e_3\} {e1,e2,e3}为 R 3 R^3 R3的标准基。之所以称这个基为标准基,使用因为使用这个基表示向量空间 R 3 R^3 R3最自然。更一般地, R n R^n Rn的标准基集为集合 { e 1 , e 2 , ⋯ , e n } \{e_1,e_2,\cdots,e_n\} {e1,e2,⋯,en}。
其中单位矩阵 I I I的第 j j j列向量的记为 e j e_j ej。具体可见下面单位矩阵的定义。
行列式
行列式的引入
用消元法解二元线性方程组
{
a
11
x
1
+
a
12
x
2
=
b
1
,
a
21
x
1
+
a
22
x
2
=
b
2
.
(1)
\begin{cases} a_{11}x_1 + a_{12}x_2 = b_1, \\ a_{21}x_1 + a_{22}x_2 = b_2. \end{cases} \tag{1}
{a11x1+a12x2=b1,a21x1+a22x2=b2.(1)
为消去未知数
x
2
x_2
x2,以
a
22
a_{22}
a22与
a
12
a_{12}
a12分别乘上列两方程的两端,然后两个方程相减,得
a
11
a
22
x
1
+
a
12
a
22
x
2
−
a
12
a
21
x
1
−
a
12
a
22
x
2
=
b
1
a
22
−
a
12
b
2
(
a
11
a
22
−
a
12
a
21
)
x
1
=
b
1
a
22
−
a
12
b
2
a_{11}a_{22}x_1 + \bcancel{a_{12}a_{22}x_2} - a_{12}a_{21}x_1 - \bcancel{a_{12}a_{22}x_2} = b_1a_{22} - a_{12}b_2 \\ (a_{11}a_{22}-a_{12}a_{21})x_1 = b_1a_{22} - a_{12}b_2
a11a22x1+a12a22x2
−a12a21x1−a12a22x2
=b1a22−a12b2(a11a22−a12a21)x1=b1a22−a12b2
类似地,消去
x
1
x_1
x1,得
(
a
11
a
22
−
a
12
a
21
)
x
2
=
a
11
b
2
−
b
1
a
21
(a_{11}a_{22} - a_{12}a_{21})x_2 = a_{11}b_2 - b_1a_{21}
(a11a22−a12a21)x2=a11b2−b1a21
当
a
11
a
22
−
a
12
a
21
≠
0
a_{11}a_{22} - a_{12}a_{21} \neq 0
a11a22−a12a21=0时,求得方程组
(
1
)
(1)
(1)的解为
x
1
=
b
1
a
22
−
a
12
b
2
a
11
a
22
−
a
12
a
21
,
x
2
=
a
11
b
2
−
b
1
a
21
a
11
a
22
−
a
12
a
21
(2)
x_1 = \frac{b_1a_{22}-a_{12}b_2 }{a_{11}a_{22} - a_{12}a_{21}}, \quad x_2 = \frac{a_{11}b_2 - b_1a_{21}}{a_{11}a_{22} - a_{12}a_{21}} \tag{2}
x1=a11a22−a12a21b1a22−a12b2,x2=a11a22−a12a21a11b2−b1a21(2)
其中分母是由方程组
(
1
)
(1)
(1)的四个系数确定的,把这四个数按它们在方程组中的位置,排列成二行二列的数表
a
11
a
12
a
21
a
22
,
(3)
\begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix}, \tag{3}
a11a21a12a22,(3)
表达式
a
11
a
22
−
a
12
a
21
a_{11}a_{22} - a_{12}a_{21}
a11a22−a12a21称为数表
(
3
)
(3)
(3)所确定的
二阶行列式
\color{blue}{二阶行列式}
二阶行列式,并记作
∣
a
11
a
12
a
21
a
22
∣
.
(4)
\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}. \tag{4}
a11a21a12a22
.(4)
数
a
i
j
(
i
=
1
,
2
;
j
=
1
,
2
)
a_{ij}(i=1,2;j=1,2)
aij(i=1,2;j=1,2)称为行列式
(
4
)
(4)
(4)的元素或元。位于第
i
i
i行第
j
j
j列的元素称为行列式
(
4
)
(4)
(4)的
(
i
,
j
)
(i,j)
(i,j)元。
二阶行列式的定义,可以用对角线法则来记忆,比如写一个字母``X
,先写
`,为主对角线;再写/
,为副对角线。二阶行列式就是主对角线上的两元素之积减去副对角线两元素之积。
利用二阶行列式的概念,
(
2
)
(2)
(2)式中
x
1
,
x
2
x_1,x_2
x1,x2的分子也可以写成二阶行列式,即
b
1
a
22
−
a
12
b
2
=
∣
b
1
a
12
b
2
a
22
∣
,
a
11
b
2
−
b
1
a
21
=
∣
a
11
b
1
a
21
b
2
∣
.
b_1a_{22} -a_{12}b_2 =\begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix},\quad a_{11}b_2 -b_1a_{21} =\begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix}.
b1a22−a12b2=
b1b2a12a22
,a11b2−b1a21=
a11a21b1b2
.
若记
D
=
∣
a
11
a
12
a
21
a
22
∣
,
D
1
=
∣
b
1
a
12
b
2
a
22
∣
,
D
2
=
∣
a
11
b
1
a
21
b
2
∣
,
D = \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}, \quad D_1 = \begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix}, \quad D_2 = \begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix},
D=
a11a21a12a22
,D1=
b1b2a12a22
,D2=
a11a21b1b2
,
那么
(
2
)
(2)
(2)式可写成
x
1
=
D
1
D
=
∣
b
1
a
12
b
2
a
22
∣
∣
a
11
a
12
a
21
a
22
∣
,
x
2
=
D
2
D
=
∣
a
11
b
1
a
21
b
2
∣
∣
a
11
a
12
a
21
a
22
∣
x_1 = \frac{D_1}{D} = \frac{\begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix}}{\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}},\quad x_2 = \frac{D_2}{D} = \frac{\begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix}}{\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}}
x1=DD1=
a11a21a12a22
b1b2a12a22
,x2=DD2=
a11a21a12a22
a11a21b1b2
这里的分母 D D D是由方程组 ( 1 ) (1) (1)的系数所确定的二阶行列式, x 1 x_1 x1的分子 D 1 D_1 D1是用常数项 b 1 , b 2 b_1,b_2 b1,b2替换 D D D中 x 1 x_1 x1的系数 a 11 , a 21 a_{11},a_{21} a11,a21所得的二阶行列式;
x 2 x_2 x2的分子 D 2 D_2 D2是用 b 1 , b 2 b_1,b_2 b1,b2替换 D D D中 x 2 x_2 x2的系数 a 12 , a 22 a_{12},a_{22} a12,a22所得的二阶行列式。
定义 设有9个数排成3行3列的数表
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
,
(5)
\begin{matrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{matrix}, \tag{5}
a11a21a31a12a22a32a13a23a33,(5)
记
∣
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
=
a
11
a
22
a
33
+
a
12
a
23
a
31
+
a
13
a
21
a
32
−
a
11
a
23
a
32
−
a
12
a
21
a
33
−
a
13
a
22
a
31
(6)
\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} +a_{13}a_{21}a_{32} \\ \qquad\qquad\qquad\qquad- a_{11}a_{23}a_{32} - a_{12}a_{21}a_{33} - a_{13}a_{22}a_{31} \tag{6}
a11a21a31a12a22a32a13a23a33
=a11a22a33+a12a23a31+a13a21a32−a11a23a32−a12a21a33−a13a22a31(6)
式
(
6
)
(6)
(6)称为数表
(
5
)
(5)
(5)所确定的三阶行列式。
上述定义表面三阶行列式含6项,每项均为不同行不同列的三个元素的乘积再冠以正负号。
虽然三阶行列式也适用于对角线法则,为了研究四阶及更高阶行列式,下面先介绍有关全排列的知识。
逆序数
对于 n n n个不同的元素,在这 n n n个元素的任一排列中,当某两个元素的先后次序与标准次序(比如可规定由小到大为标准次序)不同时,就说有1个逆序。 一个排列中所有逆序的总数叫做这个排列的逆序数。
逆序数为技术的排列叫做奇排列,逆序数为偶数的排列叫做偶排列。
设
n
n
n个元素为
1
1
1至
n
n
n这
n
n
n个自然数,并规定由小到大为标准次序。设
p
1
p
2
⋯
p
n
p_1p_2\cdots p_n
p1p2⋯pn
为这
n
n
n个自然数的一个排列,考虑元素
p
i
(
i
=
1
,
2
,
⋯
,
n
)
p_i(i=1,2,\cdots,n)
pi(i=1,2,⋯,n),如果比
p
i
p_i
pi大的且排在
p
i
p_i
pi前面的元素有
t
i
t_i
ti个,就说
p
i
p_i
pi这个元素的逆序数是
t
i
t_i
ti。全体元素的逆序数之总和
t
=
t
1
+
t
2
+
⋯
+
t
n
=
∑
t
=
1
n
t
i
,
t = t_1 + t_2 + \cdots + t_n = \sum_{t=1}^n t_i,
t=t1+t2+⋯+tn=t=1∑nti,
即使这个排列的逆序数。
来看一个例子理解。
例 求排列32514的逆序数
解 在排列32514中:
-
3排在首位,逆序数为0
-
2的前面比2大的数有一个(3),逆序数为1
-
5是最大数,逆序数为0
-
1的前面比1大的数有三个(3,2,5),逆序数为3
-
4的前面比4大的数有一个(5),逆序数为1,于是这个排列的逆序数为
t = 0 + 1 + 0 + 3 + 1 = 5 t = 0 + 1 + 0 +3 + 1 =5 t=0+1+0+3+1=5
n阶行列式的定义
为了给出
n
n
n阶行列式的定义,先来研究三阶行列式的结构。三阶行列式定义为
∣
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
=
a
11
a
22
a
33
+
a
12
a
23
a
31
+
a
13
a
21
a
32
−
a
11
a
23
a
32
−
a
12
a
21
a
33
−
a
13
a
22
a
31
\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} +a_{13}a_{21}a_{32} \\ \qquad\qquad\qquad\qquad- a_{11}a_{23}a_{32} - a_{12}a_{21}a_{33} - a_{13}a_{22}a_{31}
a11a21a31a12a22a32a13a23a33
=a11a22a33+a12a23a31+a13a21a32−a11a23a32−a12a21a33−a13a22a31
容易看出:
- 上式右边的每一项都恰是三个元素的乘积,这三个元素位于不同的行、不同列。因此,上式右端的任一项除正负号外可以写成 a 1 p 1 a 2 p 2 a 3 p 3 a_{1p_1}a_{2p_2}a_{3p_3} a1p1a2p2a3p3。这里第一个下标(行标)排成标准次序123,而第二下标(列标)排成 p 1 p 2 p 3 p_1p_2p_3 p1p2p3,它是1,2,3三个数的某个排列。这样的排列共有6中,对应上式右端共有6项。
- 各项的正负号与列标的排列对照
- 带正号的三项列标排列是123,231,312
- 带负号的三项列标排列是132,213,321
经计算可知前三个排列都是偶排列,后三个排列都是奇排列。因此各项所带的正负号可以表示为 ( − 1 ) t (-1)^t (−1)t,其中 t t t为列标排列的逆序数。
总之,三阶行列式可以写成
∣
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
=
∑
(
−
1
)
t
a
1
p
1
a
2
p
2
a
3
p
3
,
\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = \sum (-1)^t a_{1p_1}a_{2p_2}a_{3p_3},
a11a21a31a12a22a32a13a23a33
=∑(−1)ta1p1a2p2a3p3,
其中
t
t
t为排列
p
1
p
2
p
3
p_1p_2p_3
p1p2p3的逆序数,
∑
\sum
∑表示对1,2,3三个数的所有排列
p
1
p
2
p
3
p_1p_2p_3
p1p2p3去和。
仿此,可以把行列式推广到一般情形。
定义 设有
n
2
n^2
n2个数,排成
n
n
n行
n
n
n列的数表
∣
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋯
⋯
⋯
⋯
a
n
1
a
n
2
⋯
a
n
n
∣
,
\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots &\cdots & \cdots & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix},
a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann
,
作出表中位于不同行不同列的
n
n
n个数的乘积,并冠以符号
(
−
1
)
t
(-1)^t
(−1)t,得到形如
(
−
1
)
t
a
1
p
1
a
2
p
2
⋯
a
n
p
n
(7)
(-1)^t a_{1p_1}a_{2p_2}\cdots a_{np_n} \tag{7}
(−1)ta1p1a2p2⋯anpn(7)
的项,其中
p
1
p
2
⋯
p
n
p_1p_2\cdots p_n
p1p2⋯pn为自然数
1
,
2
,
⋯
,
n
1,2,\cdots,n
1,2,⋯,n的一个排列,
t
t
t为这个排列的逆序数。
由于这样的排列共有
n
!
n!
n!个,因为形如
(
7
)
(7)
(7)式的项共有
n
!
n!
n!个。所有这
n
!
n!
n!项的代数和
∑
(
−
1
)
t
a
1
p
1
a
2
p
2
⋯
a
n
p
n
\sum (-1)^t a_{1p_1}a_{2p_2} \cdots a_{np_n}
∑(−1)ta1p1a2p2⋯anpn
称为
n
n
n阶行列式,记作
D
=
∣
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋯
⋯
⋯
⋯
a
n
1
a
n
2
⋯
a
n
n
∣
,
D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots &\cdots & \cdots & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix},
D=
a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann
,
简记作
d
e
t
(
a
i
j
)
det(a_{ij})
det(aij),其中数
a
i
j
a_{ij}
aij为行列式
D
D
D的
(
i
,
j
)
(i,j)
(i,j)元。
例5 证明
n
n
n阶行列式
∣
λ
1
λ
2
⋱
λ
n
∣
=
λ
1
λ
2
⋯
λ
n
,
∣
λ
1
λ
2
⋯
λ
n
∣
=
(
−
1
)
n
(
n
−
1
)
2
λ
1
λ
2
⋯
λ
n
\begin{vmatrix} \lambda_1 & & & \\ & \lambda2 && \\ & & \ddots & \\ & & & \lambda_n\\ \end{vmatrix} = \lambda_1\lambda_2 \cdots \lambda_n, \\ \begin{vmatrix} & & &\lambda_1 \\ & &\lambda2& \\ & \cdots & & \\ \lambda_n & & & \\ \end{vmatrix} = (-1)^{\frac{n(n-1)}{2}} \lambda_1\lambda_2 \cdots \lambda_n
λ1λ2⋱λn
=λ1λ2⋯λn,
λn⋯λ2λ1
=(−1)2n(n−1)λ1λ2⋯λn
其中为写出的元素都是0。
证 第一式左端称为对角行列式,只能取不同行不同列,我们只考虑非零的情况。第 1 1 1行只能取第 1 1 1列,第二行只能取第 2 2 2列, ⋯ \cdots ⋯,第 n n n行只能取第 n n n列,最终结果很显然。
第二式第 1 1 1行只能取第 n n n列,对应的是 a 1 n a_{1n} a1n,第 2 2 2行只能取第 n − 1 n-1 n−1列,对应 a 2 n − 1 a_{2n-1} a2n−1, ⋯ \cdots ⋯,第 n n n行只能取第 1 1 1列,对应 a n 1 a_{n1} an1。
列标的排列为
n
(
n
−
1
)
⋯
2
1
n(n-1)\cdots 2\,1
n(n−1)⋯21
所以,逆序数
t
t
t为
t
=
0
+
1
+
2
+
⋯
+
(
n
−
1
)
=
n
(
n
−
1
)
2
t = 0 + 1 + 2 + \cdots + (n-1) = \frac{n(n-1)}{2}
t=0+1+2+⋯+(n−1)=2n(n−1)
例6 证明下三角形行列式
D
=
∣
a
11
0
a
21
a
22
⋮
⋮
⋱
a
n
1
a
n
2
⋯
a
n
n
∣
=
a
11
a
22
⋯
a
n
n
.
D = \begin{vmatrix} a_{11} & & & 0 \\ a_{21} & a_{22} && \\ \vdots & \vdots & \ddots & \\ a_{n1} & a_{n2} &\cdots & a_{nn}\\ \end{vmatrix} = a_{11}a_{22}\cdots a_{nn}.
D=
a11a21⋮an1a22⋮an2⋱⋯0ann
=a11a22⋯ann.
第
1
1
1行只能取第
1
1
1列,第二行只能取第
2
2
2列,
⋯
\cdots
⋯,第
n
n
n行只能取第
n
n
n列,并且列标是
12
⋯
n
12 \cdots n
12⋯n
逆序数为
0
0
0,
(
−
1
)
0
=
1
(-1)^0=1
(−1)0=1
所以结果就是其主对角线上的元素之积。
定理5 如果齐次线性方程组 ( 10 ) (10) (10)的系数行列式 D ≠ 0 D \neq 0 D=0,则齐次线性方程组 ( 10 ) (10) (10)没有非零解。
定理5’ 如果齐次线性方程组 ( 10 ) (10) (10)有非零解,则它的系数行列式必为零。