特殊矩阵
block_diag (*arrs) | Create a block diagonal matrix from provided arrays. |
---|---|
circulant © | Construct a circulant matrix. |
companion (a) | Create a companion matrix. |
convolution_matrix (a, n[, mode]) | Construct a convolution matrix. |
dft (n[, scale]) | Discrete Fourier transform matrix. |
fiedler (a) | Returns a symmetric Fiedler matrix |
fiedler_companion (a) | Returns a Fiedler companion matrix |
hadamard (n[, dtype]) | Construct an Hadamard matrix. |
hankel (c[, r]) | Construct a Hankel matrix. |
helmert (n[, full]) | Create an Helmert matrix of order n. |
hilbert (n) | Create a Hilbert matrix of order n. |
invhilbert (n[, exact]) | Compute the inverse of the Hilbert matrix of order n. |
leslie (f, s) | Create a Leslie matrix. |
pascal (n[, kind, exact]) | Returns the n x n Pascal matrix. |
invpascal (n[, kind, exact]) | Returns the inverse of the n x n Pascal matrix. |
toeplitz (c[, r]) | Construct a Toeplitz matrix. |
block_diag (*arrs) | 根据提供的数组创建一个块对角矩阵。 |
---|---|
circulant (三) | 构造一个循环矩阵。 |
companion (一个) | 创建一个伴随矩阵。 |
convolution_matrix (a,n[,模式]) | 构建一个卷积矩阵。 |
dft (n[,比例]) | 离散傅里叶变换矩阵。 |
fiedler (一个) | 返回对称 Fiedler 矩阵 |
fiedler_companion (一个) | 返回 Fiedler 伴随矩阵 |
hadamard (n[,数据类型]) | 构造一个 Hadamard 矩阵。 |
hankel (c[, r]) | 构建 Hankel 矩阵。 |
helmert (n[, 全]) | 创建n阶的 Helmert 矩阵。 |
hilbert (名词) | 创建n阶希尔伯特矩阵。 |
invhilbert (n[,精确]) | 计算n阶希尔伯特矩阵的逆。 |
leslie (女,女) | 创建一个 Leslie 矩阵。 |
pascal (n[, 种类, 确切]) | 返回 nxn Pascal 矩阵。 |
invpascal (n[, 种类, 确切]) | 返回 nxn 帕斯卡矩阵的逆。 |
toeplitz (c[, r]) | 构建托普利茨矩阵。 |
1.矩阵的形状
1.1 长方形矩阵(Rectangular Matrix)
定义
长方形矩阵(Rectangular Matrix) 是指行数和列数不相等的矩阵。
如果一个矩阵有
m
m
m行和
n
n
n列,当
m
≠
n
m\neq n
m=n时,它就是长方形矩阵。
示例
例如,一个
3
×
4
3\times 4
3×4的矩阵,即有 3 行 4 列:
[
a
11
a
12
a
13
a
14
a
21
a
22
a
23
a
24
a
31
a
32
a
33
a
34
]
\begin{bmatrix} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34} \end{bmatrix}
a11a21a31a12a22a32a13a23a33a14a24a34
这里
m
=
3
m = 3
m=3,
n
=
4
n = 4
n=4,所以它是一个长方形矩阵。
与其他矩阵的区别
- 与方阵对比: - 方阵的行数和列数相等,而长方形矩阵的行数和列数不相等。例如,一个 4 × 4 4\times 4 4×4的矩阵是方阵,而上述的 3 × 4 3\times 4 3×4矩阵是长方形矩阵。
- 与向量对比: - 当长方形矩阵只有一行或一列时,它可以看作是行向量或列向量。例如,一个 1 × n 1\times n 1×n的矩阵是行向量,一个 m × 1 m\times 1 m×1的矩阵是列向量。
应用
- 线性方程组:在表示线性方程组时,如果未知数的个数与方程的个数不相等,系数矩阵就是长方形矩阵。例如,对于方程组 { a 1 x + b 1 y + c 1 z = d 1 a 2 x + b 2 y + c 2 z = d 2 \begin{cases}a_1x + b_1y + c_1z = d_1\\a_2x + b_2y + c_2z = d_2\end{cases} {a1x+b1y+c1z=d1a2x+b2y+c2z=d2,其系数矩阵为 [ a 1 b 1 c 1 a 2 b 2 c 2 ] \begin{bmatrix}a_1 & b_1 & c_1\\a_2 & b_2 & c_2\end{bmatrix} [a1a2b1b2c1c2],这是一个 2 × 3 2\times 3 2×3的长方形矩阵。
- 数据处理:在数据分析中,长方形矩阵可以用来表示不同维度的数据。例如,一行可以表示一个样本的多个特征,一列可以表示一个特征在不同样本中的值。如果样本数量和特征数量不相等,那么数据矩阵就是长方形矩阵。
- 图像处理:在图像处理中,长方形矩阵可以用来表示图像的像素值。例如,一个图像的宽度和高度不相等时,其像素值可以用一个长方形矩阵来表示。每一行可以表示图像的一行像素,每一列可以表示图像的一种颜色通道或一个像素的特定属性。
1.2 正方形矩阵(Square Matrix)
定义
正方形矩阵,也称为方阵(Square Matrix),是行数和列数相等的矩阵。
示例
以下是几个不同大小的正方形矩阵示例:
-
2x2 正方形矩阵
A = [ 1 2 3 4 ] A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} A=[1324] -
3x3 正方形矩阵
B = [ 5 6 7 8 9 10 11 12 13 ] B = \begin{bmatrix} 5 & 6 & 7 \\ 8 & 9 & 10 \\ 11 & 12 & 13 \end{bmatrix} B= 5811691271013 -
4x4 正方形矩阵
C = [ 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 ] C = \begin{bmatrix} 14 & 15 & 16 & 17 \\ 18 & 19 & 20 & 21 \\ 22 & 23 & 24 & 25 \\ 26 & 27 & 28 & 29 \end{bmatrix} C= 14182226151923271620242817212529 -
5x5 正方形矩阵,包含零和负数
D = [ − 1 0 3 4 0 0 − 5 0 7 8 9 10 − 11 0 13 14 0 16 − 17 18 19 20 21 22 − 23 ] D = \begin{bmatrix} -1 & 0 & 3 & 4 & 0 \\ 0 & -5 & 0 & 7 & 8 \\ 9 & 10 & -11 & 0 & 13 \\ 14 & 0 & 16 & -17 & 18 \\ 19 & 20 & 21 & 22 & -23 \end{bmatrix} D= −10914190−51002030−111621470−1722081318−23
应用
正方形矩阵在数学和科学中非常重要,因为它们与线性变换、特征值、行列式和矩阵的逆等概念密切相关。在上述示例中,每个矩阵的行数和列数相同,这是正方形矩阵的基本特征。
1.3 长方形矩阵(Rectangular Matrix) vs. 正方形矩阵(Square Matrix)
长方形矩阵和正方形矩阵主要有以下区别:
定义
- 长方形矩阵: 行数和列数不相等的矩阵称为长方形矩阵。 - 结构特点:其行列数目不同,例如一个 m × n m\times n m×n的长方形矩阵,其中 m ≠ n m\neq n m=n。比如一个 3 × 4 3\times 4 3×4的矩阵,有三行四列,元素呈矩形排列,且行列数量不相等。
- 正方形矩阵: 行数和列数相等的矩阵。 - 结构特点:具有相同数量的行和列,比如一个 n × n n\times n n×n的矩阵。例如一个 4 × 4 4\times 4 4×4的矩阵,横竖都是四行(列),其结构更加规整对称。
性质
- 行列式: 正方形矩阵可以计算行列式的值,行列式在很多数学和工程领域中有重要的应用,如判断矩阵是否可逆、求解线性方程组等。而长方形矩阵没有行列式的概念。例如对于一个 3 × 3 3\times 3 3×3的正方形矩阵,可以通过特定的算法计算出一个确定的数值作为行列式的值。但对于一个 3 × 4 3\times 4 3×4的长方形矩阵,无法计算行列式。
- 可逆性: 正方形矩阵如果行列式不为零,则该矩阵可逆,存在逆矩阵。可以通过一系列的运算找到逆矩阵,在求解线性方程组等问题中有重要作用。 - 长方形矩阵一般不存在逆矩阵的概念。因为其结构不对称,无法满足逆矩阵的定义要求。
- 特征值与特征向量:正方形矩阵可以计算特征值和特征向量。特征值和特征向量在很多领域如物理、工程、计算机科学等中有广泛应用,例如在主成分分析(PCA)等数据分析方法中,就是通过计算数据矩阵的特征值和特征向量来进行降维和数据压缩。 - 长方形矩阵通常没有明确的特征值和特征向量的定义。
应用场景
长方形矩阵:
- 线性方程组的表示:在表示线性方程组时,如果未知数的个数与方程的个数不相等,系数矩阵就是长方形矩阵。例如对于方程组
{ a 1 x + b 1 y + c 1 z = d 1 a 2 x + b 2 y + c 2 z = d 2 a 3 x + b 3 y + c 3 z = d 3 a 4 x + b 4 y + c 4 z = d 4 \begin{cases}a_1x + b_1y + c_1z = d_1\\a_2x + b_2y + c_2z = d_2\\a_3x + b_3y + c_3z = d_3\\a_4x + b_4y + c_4z = d_4\end{cases} ⎩ ⎨ ⎧a1x+b1y+c1z=d1a2x+b2y+c2z=d2a3x+b3y+c3z=d3a4x+b4y+c4z=d4,
其系数矩阵为
[ a 1 b 1 c 1 a 2 b 2 c 2 a 3 b 3 c 3 a 4 b 4 c 4 ] \begin{bmatrix}a_1 & b_1 & c_1\\a_2 & b_2 & c_2\\a_3 & b_3 & c_3\\a_4 & b_4 & c_4\end{bmatrix} a1a2a3a4b1b2b3b4c1c2c3c4 ,
这是一个 4 × 3 4\times 3 4×3的长方形矩阵。在这种情况下,可以通过矩阵的运算来求解线性方程组,但求解方法与正方形矩阵的情况有所不同。 - 数据处理中的应用:在数据分析中,长方形矩阵可以用来表示不同维度的数据。例如,一行可以表示一个样本的多个特征,一列可以表示一个特征在不同样本中的值。如果样本数量和特征数量不相等,那么数据矩阵就是长方形矩阵。在机器学习和数据分析中,经常会遇到这种情况,需要针对长方形矩阵的特点进行数据处理和算法设计。
正方形矩阵:
- 线性变换的表示:在数学和物理学中,正方形矩阵可以表示线性变换。例如,在二维或三维空间中的旋转、缩放、反射等线性变换都可以用正方形矩阵来表示。通过矩阵乘法,可以将一个向量进行线性变换,得到变换后的向量。
- 图像处理中的应用:在图像处理中,很多操作可以用正方形矩阵来表示。例如,图像的旋转、缩放、滤波等操作都可以通过对图像像素矩阵进行特定的正方形矩阵运算来实现。正方形矩阵的对称性和良好的数学性质使得这些操作更加方便和高效。
1.4 三角形矩阵(Triangular Matrix)
定义
三角形矩阵(Triangular Matrix) 是线性代数中的一个重要概念,这类矩阵在理论和实际应用中都有广泛的应用。三角形矩阵可以分为两大类:下三角矩阵(Lower Triangular Matrix)和上三角矩阵(Upper Triangular Matrix)。
下三角矩阵(Lower Triangular Matrix)
一个
n
×
n
n \times n
n×n的方阵
A
A
A称为下三角矩阵,如果矩阵的所有位于主对角线以上的元素都为零。形式上,如果
A
=
[
a
i
j
]
A = [a_{ij}]
A=[aij],那么对于所有的
i
<
j
i < j
i<j,有
a
i
j
=
0
a_{ij} = 0
aij=0。
上三角矩阵(Upper Triangular Matrix)
一个
n
×
n
n \times n
n×n的方阵
A
A
A称为上三角矩阵,如果矩阵的所有位于主对角线以下的元素都为零。形式上,如果
A
=
[
a
i
j
]
A = [a_{ij}]
A=[aij],那么对于所有的
i
>
j
i > j
i>j,有
a
i
j
=
0
a_{ij} = 0
aij=0。
示例
一个
3
×
3
3 \times 3
3×3的下三角矩阵
L
L
L可以表示为:
L
=
(
l
11
0
0
l
21
l
22
0
l
31
l
32
l
33
)
L = \begin{pmatrix} l_{11} & 0 & 0 \\ l_{21} & l_{22} & 0 \\ l_{31} & l_{32} & l_{33} \end{pmatrix}
L=
l11l21l310l22l3200l33
一个
3
×
3
3 \times 3
3×3的上三角矩阵
U
U
U可以表示为:
U
=
(
u
11
u
12
u
13
0
u
22
u
23
0
0
u
33
)
U = \begin{pmatrix} u_{11} & u_{12} & u_{13} \\ 0 & u_{22} & u_{23} \\ 0 & 0 & u_{33} \end{pmatrix}
U=
u1100u12u220u13u23u33
性质
三角形矩阵具有以下一些重要的性质:
- 对角线元素:三角形矩阵的对角线元素通常是重要的,因为它们决定了矩阵的一些关键性质,比如行列式的值。
- 行列式:三角形矩阵的行列式等于其对角线元素的乘积。如果一个三角形矩阵是上三角或下三角的,那么它的行列式等于对角线元素的乘积。
- 逆矩阵:如果一个三角形矩阵是可逆的(即对角线元素均非零),那么它的逆矩阵也是一个三角形矩阵,且与原矩阵有相同的三角形状。
- 乘法:两个同类型的三角形矩阵相乘(例如,两个上三角矩阵相乘)的结果仍然是同类型的三角形矩阵。
- 解线性方程组:三角形矩阵非常适合用于解线性方程组。上三角矩阵可以通过回代法(back substitution)求解,而下三角矩阵可以通过前代法(forward substitution)求解。
应用
三角形矩阵在许多领域都有广泛的应用,包括但不限于:
- 数值分析:在求解线性方程组时,三角形矩阵提供了高效且稳定的求解方法。
- 矩阵分解:许多矩阵分解方法(如LU分解、Cholesky分解)都会产生三角形矩阵。
- 控制系统:在控制系统理论中,三角形矩阵用于描述系统的状态空间模型。
- 优化理论:在优化问题中,三角形矩阵可以帮助简化问题的求解过程。
- 图形学:在计算机图形学中,三角形矩阵用于表示变换矩阵,如旋转和平移。
总结
三角形矩阵因其特殊的结构而具有很多有用的性质,使得它们在理论和实际应用中都非常有用。无论是上三角矩阵还是下三角矩阵,它们都简化了许多线性代数问题的求解过程。
1.5 托普利茨矩阵(Toeplitz matrix)
定义
托普利茨矩阵(Toeplitz matrix) 是一种 特殊的方阵 或矩形矩阵,其中每个对角线(从左上到右下)上的元素都是相同的。换句话说,如果
A
A
A是一个 Toeplitz 矩阵,那么对于所有的
i
i
i和
j
j
j,如果
i
−
j
=
k
i - j = k
i−j=k,则
a
i
j
=
a
(
i
+
1
)
(
j
+
1
)
a_{ij} = a_{(i+1)(j+1)}
aij=a(i+1)(j+1)。
示例
一个
n
×
n
n \times n
n×n的 Toeplitz 矩阵
A
A
A可以表示为:
A
=
[
a
0
a
−
1
a
−
2
…
a
−
(
n
−
2
)
a
−
(
n
−
1
)
a
1
a
0
a
−
1
…
a
−
(
n
−
3
)
a
−
(
n
−
2
)
a
2
a
1
a
0
…
a
−
(
n
−
4
)
a
−
(
n
−
3
)
⋮
⋮
⋮
⋱
⋮
⋮
a
n
−
2
a
n
−
3
a
n
−
4
…
a
0
a
−
1
a
n
−
1
a
n
−
2
a
n
−
3
…
a
1
a
0
]
A = \begin{bmatrix} a_0 & a_{-1} & a_{-2} & \ldots & a_{-(n-2)} & a_{-(n-1)} \\ a_1 & a_0 & a_{-1} & \ldots & a_{-(n-3)} & a_{-(n-2)} \\ a_2 & a_1 & a_0 & \ldots & a_{-(n-4)} & a_{-(n-3)} \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{n-2} & a_{n-3} & a_{n-4} & \ldots & a_0 & a_{-1} \\ a_{n-1} & a_{n-2} & a_{n-3} & \ldots & a_1 & a_0 \\ \end{bmatrix}
A=
a0a1a2⋮an−2an−1a−1a0a1⋮an−3an−2a−2a−1a0⋮an−4an−3………⋱……a−(n−2)a−(n−3)a−(n−4)⋮a0a1a−(n−1)a−(n−2)a−(n−3)⋮a−1a0
这里,每一行相对于前一行而言,元素都是向右移动了一个位置,同时添加了新的元素在行的最左边,并移除了行的最右边的元素。
一个 4×4 的 Toeplitz 矩阵可能看起来像这样:
A
=
[
2
3
4
5
1
2
3
4
0
1
2
3
−
1
0
1
2
]
A = \begin{bmatrix} 2 & 3 & 4 & 5 \\ 1 & 2 & 3 & 4 \\ 0 & 1 & 2 & 3 \\ -1 & 0 & 1 & 2 \\ \end{bmatrix}
A=
210−1321043215432
在这个例子中,对角线上的元素分别是 2, 1, 0, -1 对应于主对角线左侧,以及 3, 4, 5 对应于主对角线右侧。这些值沿着各自的对角线重复出现。
应用
Toeplitz 矩阵得名于德国数学家奥托·托普利茨(Otto Toeplitz),他在数学分析领域做出了许多贡献,包括对这类特殊矩阵的研究。Toeplitz 矩阵因其独特的结构,在理论数学和应用数学中都有广泛的应用。下面是一些常见的应用场景:
- 信号处理:在信号处理中, Toeplitz 矩阵经常出现在自相关函数的表示中。当处理时间序列数据时,如果假设信号是平稳的,则其自相关矩阵通常是 Toeplitz 形式的。
- 图像处理:在图像处理中,卷积操作可以通过 Toeplitz 矩阵来实现。这种矩阵形式可以帮助加速图像滤波算法的计算。
- 控制系统:控制系统的设计中,系统的状态空间模型可能会涉及到 Toeplitz 矩阵。特别是在线性预测编码(LPC)等方法中,Toeplitz 矩阵用于建模和分析系统的行为。
- 数值分析:在求解偏微分方程的数值方法中,如有限差分法,Toeplitz 矩阵可以用来表示离散化的线性算子。
- 线性代数:由于 Toeplitz 矩阵具有特殊的结构,它们在数值线性代数中有特别的算法,可以有效地解决 Toeplitz 矩阵相关的线性系统,如使用快速傅里叶变换(FFT)进行求解。
- 统计学:在统计学中, Toeplitz 矩阵可以用于描述时间序列数据的协方差结构,特别是当数据点之间的协方差仅依赖于时间间隔时。
- 电路理论:在电路理论中,当分析某些类型的电路时,也会遇到 Toeplitz 矩阵,特别是在处理连续时间系统的情况下。
Toeplitz 矩阵的研究不仅限于以上领域,随着科学和技术的发展,它们的应用也在不断扩展。由于 Toeplitz 矩阵具有的结构特性,许多高效算法被开发出来以利用这些结构来提高计算效率。
1.6 循环矩阵(Circulant Matrix)
定义
循环矩阵(Circulant Matrix) 是一类 特殊的托普利兹(Toeplitz)矩阵。如果一个矩阵的每一行都是由它的上一行循环右移得到,并且第一行由最后一行循环右移得到,那么这个矩阵就是循环矩阵。其一般形式如下:
C = [ c 0 c 1 c 2 ⋯ c n − 1 c n − 1 c 0 c 1 c 2 ⋯ c n − 1 c 0 c 1 ⋱ ⋮ ⋱ ⋱ ⋱ c 2 c 1 c 1 ⋯ c n − 1 c 0 ] C = \begin{bmatrix} c_{0} & c_{1} & c_{2} & \cdots & c_{n - 1}\\ c_{n - 1} & c_{0} & c_{1} & c_{2} & \cdots\\ & c_{n - 1} & c_{0} & c_{1} & \ddots\\ \vdots & \ddots & \ddots & \ddots & c_{2}\\ & & & & c_{1}\\ c_{1} & \cdots & & c_{n - 1} & c_{0} \end{bmatrix} C= c0cn−1⋮c1c1c0cn−1⋱⋯c2c1c0⋱⋯c2c1⋱cn−1cn−1⋯⋱c2c1c0
其中, c 0 , c 1 , c 2 , ⋯ , c n − 1 c_0, c_1, c_2, \cdots, c_{n - 1} c0,c1,c2,⋯,cn−1是矩阵的元素。
应用:
- 信号处理:
- 滤波:在音频信号处理中,循环矩阵可用于设计滤波器。例如,对音频信号进行特定频率范围的滤波操作,去除噪声或提取特定频率成分。通过将音频信号表示为向量,与循环矩阵相乘,可以实现对信号的滤波效果。
- 信号编码与解码:在通信系统中,循环矩阵可用于信号的编码和解码。例如,在纠错码的设计中,利用循环矩阵的特性可以方便地进行编码和译码操作,提高通信的可靠性。
- 图像处理:
- 图像变换:循环矩阵可用于实现图像的平移、旋转等变换操作。通过将图像的像素值表示为向量,与适当的循环矩阵相乘,可以快速地实现图像的变换。例如,在图像的拼接或合成中,需要对图像进行平移和旋转操作,循环矩阵可以提供一种高效的实现方式。
- 图像压缩:在图像压缩算法中,循环矩阵可以用于图像的特征提取和压缩。通过对图像的像素值进行矩阵变换,将图像的信息集中在少数几个特征向量上,从而实现图像的压缩。例如,基于离散余弦变换(DCT)的图像压缩算法中,就可以使用循环矩阵来实现快速的 DCT 变换。
- 数据压缩:
对于具有周期性或重复性的数据,循环矩阵可以用于数据压缩。通过分析数据的周期性特征,构建合适的循环矩阵,将数据表示为循环矩阵的特征向量和特征值,从而实现数据的压缩存储。例如,在时间序列数据的压缩中,如果数据具有周期性,就可以使用循环矩阵来进行压缩。 - 数值计算:
- 求解线性方程组:在一些特定的线性方程组求解问题中,如果系数矩阵是循环矩阵,可以利用循环矩阵的特殊结构和性质,采用快速算法求解。例如,利用循环矩阵可以被傅里叶矩阵对角化的性质,将线性方程组的求解转化为对角矩阵的求解,从而提高计算效率。
- 矩阵分解:在一些矩阵分解算法中,循环矩阵可以作为一种特殊的矩阵结构进行处理。例如,在奇异值分解(SVD)或特征值分解等算法中,对于循环矩阵可以采用特殊的分解方法,降低计算复杂度。
- 物理学中的应用:在物理问题的数值模拟中,循环矩阵可以用于构建物理模型的系数矩阵。例如,在量子力学、固体物理等领域的数值计算中,经常会遇到具有周期性结构的物理系统,循环矩阵可以很好地描述这种周期性结构,从而方便地进行数值模拟和计算。
- 编码理论:在编码理论中,循环码是一种重要的线性分组码,其编码和译码过程可以通过循环矩阵来描述和实现。循环码具有良好的纠错性能和编码效率,在通信、存储等领域得到了广泛的应用。
1.7 带状矩阵(Banded Matrix)
定义
带状矩阵(Banded Matrix) 是一种特殊的矩阵结构,在线性代数中具有重要的应用。这种矩阵的特点是除了主对角线附近的一条或几条对角线之外,其余位置的元素均为零。带状矩阵的定义和性质使得它们在数值计算中特别有用,尤其是在求解大型稀疏线性方程组时。
一个 n × n n \times n n×n的方阵 A A A称为带状矩阵,如果存在一个整数 p p p(称为上带宽)和一个整数 q q q(称为下带宽),使得对于所有的 i , j i, j i,j,当 ∣ i − j ∣ > p + q |i - j| > p + q ∣i−j∣>p+q时, a i j = 0 a_{ij} = 0 aij=0。这意味着除了主对角线以及其上方 p p p条对角线和下方 q q q条对角线之外的所有元素都是零。
- 带宽(Bandwidth):对于上三角矩阵或下三角矩阵,带宽是指对角线以上或以下有多少行包含非零元素。对于对称矩阵,带宽是指离主对角线最远的非零元素的距离。
- 上带宽(Upper Bandwidth):指的是主对角线之上有多少行包含非零元素。
- 下带宽(Lower Bandwidth):指的是主对角线之下有多少行包含非零元素。
示例
示例 1: 三对角矩阵 (Tridiagonal Matrix)
三对角矩阵是一个特殊的带状矩阵,其中每个行除了主对角线和紧邻的上下对角线外,其他位置都是零。
A
=
(
b
1
c
1
0
0
0
a
2
b
2
c
2
0
0
0
a
3
b
3
c
3
0
0
0
a
4
b
4
c
4
0
0
0
a
5
b
5
)
A = \begin{pmatrix} b_1 & c_1 & 0 & 0 & 0 \\ a_2 & b_2 & c_2 & 0 & 0 \\ 0 & a_3 & b_3 & c_3 & 0 \\ 0 & 0 & a_4 & b_4 & c_4 \\ 0 & 0 & 0 & a_5 & b_5 \end{pmatrix}
A=
b1a2000c1b2a3000c2b3a4000c3b4a5000c4b5
这里 a i , b i , c i a_i, b_i, c_i ai,bi,ci是非零元素,而其他位置都是零。这个矩阵的上带宽和下带宽都是 1。
示例 2: 一般带状矩阵
下面是一个带宽为 2 的带状矩阵示例,这意味着除了主对角线之外,上下各有两行包含非零元素:
B
=
(
x
11
x
12
x
13
0
0
x
21
x
22
x
23
x
24
0
0
x
32
x
33
x
34
x
35
0
0
x
43
x
44
x
45
0
0
0
x
54
x
55
)
B = \begin{pmatrix} x_{11} & x_{12} & x_{13} & 0 & 0 \\ x_{21} & x_{22} & x_{23} & x_{24} & 0 \\ 0 & x_{32} & x_{33} & x_{34} & x_{35} \\ 0 & 0 & x_{43} & x_{44} & x_{45} \\ 0 & 0 & 0 & x_{54} & x_{55} \end{pmatrix}
B=
x11x21000x12x22x3200x13x23x33x4300x24x34x44x5400x35x45x55
在这个例子中,上带宽是 2,下带宽也是 2。
示例 3: 对称带状矩阵
如果带状矩阵是对称的,那么它的上半部分和下半部分是对称的。例如,下面是一个带宽为 2 的对称带状矩阵:
C
=
(
p
q
r
0
0
q
p
q
r
0
r
q
p
q
r
0
r
q
p
q
0
0
r
q
p
)
C = \begin{pmatrix} p & q & r & 0 & 0 \\ q & p & q & r & 0 \\ r & q & p & q & r \\ 0 & r & q & p & q \\ 0 & 0 & r & q & p \end{pmatrix}
C=
pqr00qpqr0rqpqr0rqpq00rqp
这里,由于矩阵是对称的,我们只需要存储一半的信息即可,这可以显著节省存储空间。在实际应用中,通常只存储下半三角或上半三角以及主对角线部分。
这些矩阵在各种数值算法中都有应用,特别是那些需要解决大规模线性系统的算法。
特殊情况
- 对角矩阵:如果 p = q = 0 p = q = 0 p=q=0,即只有主对角线上的元素非零,那么矩阵被称为对角矩阵。
- 三对角矩阵:如果 p = q = 1 p = q = 1 p=q=1,即除了主对角线外,还有上下各一条对角线上的元素非零,那么矩阵被称为三对角矩阵。
- 块带状矩阵:如果矩阵的元素按块的形式分布,并且除了主对角线块及其上下各若干个对角线块外,其他位置的块均为零矩阵,那么矩阵被称为块带状矩阵。
性质
带状矩阵具有以下一些重要的性质:
- 稀疏性:带状矩阵通常是非常稀疏的,这意味着大多数元素都是零,这使得它们在存储和计算时比一般矩阵更加高效。
- 数值稳定性:带状矩阵在数值计算中表现出较好的稳定性,特别是在求解线性方程组时。
- 解线性方程组:带状矩阵可以使用专门设计的算法(如带状矩阵的LU分解)来高效求解线性方程组。
- 矩阵运算:带状矩阵的乘法和逆运算可以利用其稀疏性来减少计算量,从而提高计算效率。
应用
带状矩阵在许多领域都有广泛的应用,包括但不限于:
- 工程计算:在结构工程中,带状矩阵用于表示有限元分析中的刚度矩阵。
- 数值分析:在求解偏微分方程的数值方法中,带状矩阵常常出现在离散化后的线性方程组中。
- 信号处理:在数字信号处理中,带状矩阵可以用来表示滤波器的卷积操作。
- 优化理论:在优化问题中,带状矩阵可以简化约束条件的表示。
总结
带状矩阵因其特殊的结构而具有许多有用的性质,尤其是在处理大型稀疏矩阵时表现得更为突出。通过利用带状矩阵的稀疏性,可以显著减少内存占用和计算时间,从而提高计算效率。
1.8 伴矩阵(Companion matrix)
定义
伴矩阵(Companion matrix) 是一种特殊的方阵,它通常与多项式相关联。给定一个一元n次多项式
p
(
x
)
=
x
n
+
c
n
−
1
x
n
−
1
+
⋯
+
c
1
x
+
c
0
p(x) = x^n + c_{n-1}x^{n-1} + \cdots + c_1x + c_0
p(x)=xn+cn−1xn−1+⋯+c1x+c0,可以构造一个n阶的伴矩阵
C
C
C,形式如下:
C = [ 0 1 0 ⋯ 0 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ 1 − c 0 − c 1 − c 2 ⋯ − c n − 1 ] C = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -c_0 & -c_1 & -c_2 & \cdots & -c_{n-1} \\ \end{bmatrix} C= 00⋮0−c010⋮0−c101⋮0−c2⋯⋯⋱⋯⋯00⋮1−cn−1
示例
三次多项式
p
(
x
)
=
x
3
−
6
x
2
+
11
x
−
6
p(x) = x^3 - 6x^2 + 11x - 6
p(x)=x3−6x2+11x−6,它的伴矩阵为:
C
=
[
0
1
0
0
0
1
6
−
11
6
]
C = \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 6 & -11 & 6 \\ \end{bmatrix}
C=
00610−11016
注意,这里的系数符号已经取反。也就是说,对于多项式 x 3 − 6 x 2 + 11 x − 6 x^3 - 6x^2 + 11x - 6 x3−6x2+11x−6,伴矩阵最后一行是 [ 6 , − 11 , 6 ] [6, -11, 6] [6,−11,6],而不是 [ − 6 , 11 , − 6 ] [-6, 11, -6] [−6,11,−6]。
伴矩阵的一个重要性质是它的特征多项式与所给定的一元多项式 p ( x ) p(x) p(x)相同。这意味着如果 p ( x ) p(x) p(x)是一个多项式,那么它的根就是伴矩阵 C C C的特征值。
2.矩阵的可逆性
在矩阵论中,可逆矩阵和奇异矩阵是两个重要的概念,它们分别描述了矩阵是否具有逆矩阵的性质。
2.1 可逆矩阵(Inverse Matrix)
定义
一个
n
×
n
n \times n
n×n 的 方阵
A
A
A称为 可逆矩阵(Inverse Matrix) ,如果 存在 一个同阶方阵
B
B
B使得:
A
B
=
B
A
=
I
AB = BA = I
AB=BA=I
其中
I
I
I是
n
×
n
n \times n
n×n的单位矩阵。矩阵
B
B
B称为
A
A
A的逆矩阵,记作
A
−
1
A^{-1}
A−1,Python代码为 inv(A)
。也就是说,如果一个矩阵有逆矩阵,那么它可以与它的逆矩阵相乘得到单位矩阵。
性质
可逆矩阵满足以下性质:
- 唯一性:如果一个矩阵可逆,那么它的逆矩阵是唯一的。
- 行列式非零:一个矩阵可逆的充分必要条件是它的行列式不为零 ( det ( A ) ≠ 0 \det(A) \neq 0 det(A)=0)。
- 保持线性独立性:可逆矩阵作用于向量空间中的向量时,不会破坏向量的线性独立性。
- 解线性方程组:如果一个方程组的系数矩阵是可逆的,那么该方程组有唯一解。
应用
可逆矩阵 inv(A)
:适用于方阵且行列式不为零 的情况,可以直接求解线性方程组。在需要 精确求解 线性方程组或执行精确的矩阵操作时,可逆矩阵非常有用。例如,在密码学、控制理论、计算机图形学等领域中,可逆矩阵被用来表示变换,如旋转、缩放等。
2.2 奇异矩阵(Singular Matrix)
定义
一个
n
×
n
n \times n
n×n的 方阵
A
A
A如果 不可逆 ,则称它为 奇异矩阵(Singular Matrix) 。这意味着 不存在 矩阵
B
B
B使得:
A
B
=
B
A
=
I
AB = BA = I
AB=BA=I。
示例
下面是一个2×2的奇异矩阵的例子:
A
=
[
2
4
1
2
]
A = \begin{bmatrix} 2 & 4 \\ 1 & 2 \\ \end{bmatrix}
A=[2142]
这个矩阵的行列式为:
det
(
A
)
=
(
2
⋅
2
)
−
(
4
⋅
1
)
=
4
−
4
=
0
\text{det}(A) = (2 \cdot 2) - (4 \cdot 1) = 4 - 4 = 0
det(A)=(2⋅2)−(4⋅1)=4−4=0
因为行列式为零,所以矩阵 A A A是奇异的。
再来看一个3×3的奇异矩阵的例子:
B
=
[
1
2
3
2
4
6
1
0
−
1
]
B = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 1 & 0 & -1 \\ \end{bmatrix}
B=
12124036−1
矩阵 B B B的行列式可以通过展开计算得到,但由于第三行和第一行之间存在线性关系(第三行是第一行的线性组合),我们可以立即断言矩阵 B B B的行列式为零,因此它是奇异的。
性质
奇异矩阵满足以下性质:
- 行列式为零: 一个矩阵是奇异的 充分必要条件 是它的行列式为零 ( det ( A ) = 0 \det(A) = 0 det(A)=0 )。
- 线性依赖:奇异矩阵的列向量(或行向量)之间存在线性依赖关系,即至少有一组非零系数使得这些向量的线性组合为零向量。
- 无法求解某些线性方程组:如果一个方程组的系数矩阵是奇异的,则该方程组要么没有解,要么有无穷多解。
应用
奇异矩阵:奇异矩阵的一个直观理解是,它们不能唯一地“反转”操作。在几何上,这意味着它们会把某些方向压缩到零体积或零面积。例如,一个2×2的奇异矩阵可能会将二维平面上的一条直线映射到另一条直线上,而不是映射到整个平面。在数值线性代数中,处理奇异矩阵时需要特别小心,因为它们可能导致数值不稳定或无法求解的问题。
2.3 可逆矩阵(Inverse Matrix)vs. 奇异矩阵(Singular Matrix)
- 逆矩阵的存在性:可逆矩阵有唯一的逆矩阵,而奇异矩阵没有逆矩阵。
- 行列式的值:可逆矩阵的行列式非零,而奇异矩阵的行列式为零。
- 线性系统的解:可逆矩阵对应的线性系统有唯一解,而奇异矩阵对应的线性系统可能无解或有无穷多解。
2.4 伪逆矩阵(Pseudo-Inverse of a Matrix)
定义
广义逆矩阵,也叫伪逆矩阵(Pseudo-Inverse of a Matrix) 是指对于一个矩阵
A
A
A,即使
A
A
A不是方阵或不可逆,也可以找到一个矩阵
G
G
G,使得
G
G
G在某种意义上“接近”于
A
A
A的逆矩阵 。广义逆矩阵有许多不同的形式,最常见的是 Moore-Penrose逆矩阵 ,它满足四个特定条件:
对于一个矩阵
A
A
A,其广义逆矩阵
A
+
A^+
A+ (Python代码为 pinv(A)
),满足以下四个条件:
- A A + A = A AA^+A = A AA+A=A
- A + A A + = A + A^+AA^+ = A^+ A+AA+=A+
- ( A A + ) T = A A + (AA^+)^T = AA^+ (AA+)T=AA+ ( A A + AA^+ AA+是对称的)
- ( A + A ) T = A + A (A^+A)^T = A^+A (A+A)T=A+A ( A + A A^+A A+A是对称的)
性质
Moore-Penrose逆矩阵
A
+
A^+
A+的性质包括:
- 存在性:对于任何矩阵 A A A,无论其是否为方阵或是否可逆,Moore-Penrose逆矩阵总是存在的。
- 唯一性:Moore-Penrose逆矩阵是唯一的。
- 解线性方程组:当系数矩阵 A A A 不是方阵或不可逆时 ,可以通过 A + A^+ A+来 求解最小二乘问题或找到近似解 。
应用
广义逆矩阵 pin(A)
:适用于任何矩阵(包括非方阵和奇异矩阵) ,提供了一种近似的逆矩阵,广义逆矩阵提供了一种方法来求解线性方程组或找到 近似解 。广义逆矩阵常用于 数据拟合、回归分析、最小二乘问题 等。
2.5 可逆矩阵(Inverse Matrix)vs. 伪逆矩阵(Pseudo-Inverse of a Matrix)
-
可逆矩阵
inv(A)
:适用于方阵且行列式不为零 的情况,可以直接求解线性方程组。在需要 精确求解 线性方程组或执行精确的矩阵操作时,可逆矩阵非常有用。例如,在密码学、控制理论、计算机图形学等领域中,可逆矩阵被用来表示变换,如旋转、缩放等。 -
广义逆矩阵
pin(A)
:适用于任何矩阵(包括非方阵和奇异矩阵) ,提供了一种近似的逆矩阵,广义逆矩阵提供了一种方法来求解线性方程组或找到 近似解 。广义逆矩阵常用于 数据拟合、回归分析、最小二乘问题 等。
通过了解这两类矩阵的不同性质和应用场景,可以更好地选择合适的工具来解决实际问题。
2.6 正交矩阵 (Orthogonal Matrix)
定义
正交矩阵 (Orthogonal Matrix) 是指一个 实数矩阵
U
U
U满足以下条件:
Q T Q = Q Q T = I Q^T Q = QQ^T = I QTQ=QQT=I
其中 U T U^T UT 表示矩阵 U U U的 转置(Transpose) , I I I是单位矩阵。换句话说,一个正交矩阵的列向量(或行向量)构成一组 正交单位向量 ,即它们彼此之间的 内积为零 ,并且 每个向量的模长(即范数)为1 。正交矩阵在实数域中是非常重要的,因为它们保留了向量的长度和角度,即它们对应于旋转和平移操作。
正交矩阵是酉矩阵的一个特殊情况,它是应用于实数矩阵的。一个 n × n n \times n n×n的实数矩阵 Q Q Q被称为正交矩阵,如果它满足 Q T Q = Q Q T = I Q^T Q = QQ^T = I QTQ=QQT=I,其中 Q T Q^T QT是 Q Q Q的转置。正交矩阵同样保持向量的长度和角度不变。
示例
我们可以构造一个简单的正交矩阵,比如通过旋转矩阵的方式:
# 创建一个2x2的旋转矩阵Q,它是一个正交矩阵
theta = np.pi / 4 # 旋转角度
Q = np.array([[np.cos(theta), -np.sin(theta)],
[np.sin(theta), np.cos(theta)]])
# 计算Q的转置
Q_T = Q.T
# 计算Q * Q^T
product = np.dot(Q, Q_T)
# 输出结果以验证Q是否为正交矩阵
print("Q * Q^T = ")
print(product)
应用
在实际应用中,酉矩阵和正交矩阵常用于信号处理、量子计算等领域。
2.7 酉矩阵(Unitary Matrix)
定义
酉矩阵(Unitary Matrix) 是指一个 复数矩阵
U
U
U满足以下条件:
U H U = U U H = I U^H U = U U^H = I UHU=UUH=I
其中 U H U^H UH 表示矩阵 U U U的 共轭转置(Conjugate transpose),也称为埃尔米特转置(Hermitian transpose) 。这意味着一个酉矩阵的列向量(或行向量)构成一组 正交单位向量 ,但这里的 正交性是在复数域中定义的,即列向量之间的内积为零,并且每个向量的模长为1 。酉矩阵在量子力学、信号处理等领域中有着广泛的应用。
示例
下面是一个2x2酉矩阵的例子:
U
=
[
a
b
c
d
]
U = \begin{bmatrix} a & b \\ c & d \end{bmatrix}
U=[acbd]
为了
U
U
U成为酉矩阵,必须满足以下条件:
U
U
H
=
[
a
b
c
d
]
[
a
‾
c
‾
b
‾
d
‾
]
=
[
∣
a
∣
2
+
∣
b
∣
2
a
c
‾
+
b
d
‾
c
a
‾
+
d
b
‾
∣
c
∣
2
+
∣
d
∣
2
]
=
[
1
0
0
1
]
UU^H = \begin{bmatrix} a & b \\ c & d \end{bmatrix} \begin{bmatrix} \overline{a} & \overline{c} \\ \overline{b} & \overline{d} \end{bmatrix} = \begin{bmatrix} |a|^2 + |b|^2 & a\overline{c} + b\overline{d} \\ c\overline{a} + d\overline{b} & |c|^2 + |d|^2 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}
UUH=[acbd][abcd]=[∣a∣2+∣b∣2ca+dbac+bd∣c∣2+∣d∣2]=[1001]
这意味着 ∣ a ∣ 2 + ∣ b ∣ 2 = 1 |a|^2 + |b|^2 = 1 ∣a∣2+∣b∣2=1并且 ∣ c ∣ 2 + ∣ d ∣ 2 = 1 |c|^2 + |d|^2 = 1 ∣c∣2+∣d∣2=1,同时 a c ‾ + b d ‾ = 0 a\overline{c} + b\overline{d} = 0 ac+bd=0。
一个简单的酉矩阵示例可以是:
U
=
[
1
2
i
2
−
i
2
1
2
]
U = \begin{bmatrix} \frac{1}{\sqrt{2}} & \frac{i}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{bmatrix}
U=[21−2i2i21]
我们可以用Python来验证这个矩阵是否为单位矩阵:
import numpy as np
# 创建一个2x2的单位矩阵U
U = np.array([[1/np.sqrt(2), 1j/np.sqrt(2)],
[-1j/np.sqrt(2), 1/np.sqrt(2)]])
# 计算U的共轭转置
U_dagger = np.conjugate(U).T
# 计算U * U^H
product = np.dot(U, U_dagger)
# 输出结果以验证U是否为单位矩阵
print("U * U^H = ")
print(product)
当你运行这段代码时,你会看到输出的矩阵应该非常接近于2x2的单位矩阵,考虑到浮点运算中的小误差,某些元素可能会略有偏差,但基本上是1或0。这表明给定的矩阵 U U U是一个单位矩阵。
2.8正交矩阵 (Orthogonal Matrix) vs. 酉矩阵(Unitary Matrix)
-
相同点:正交矩阵和酉矩阵都具有相似的性质,即它们的 行列式具有绝对值为1 ,它们的 逆矩阵等于它们的转置(对于正交矩阵)或共轭转置(对于酉矩阵) 。这两种矩阵都保持了向量的长度不变,并且它们的行列式为 ± 1 \pm1 ±1。
-
不同点:正交矩阵限于实数矩阵,而酉矩阵适用于复数矩阵。因此,正交矩阵的转置就是其自身的转置,而酉矩阵的逆矩阵是其共轭转置。
-
总结:正交矩阵和酉矩阵虽然在性质上有许多相似之处,但是它们适用的域不同。正交矩阵是实数域中的概念,而酉矩阵则是复数域中的概念。在实际应用中,选择哪种矩阵取决于你正在处理的数据类型。如果你处理的是实数数据,那么你可能会使用正交矩阵;如果你处理的是复数数据,那么酉矩阵会更加合适。
3.矩阵的对称性
3.1 转置矩阵(Transpose of a Matrix)
定义
矩阵的转置(Transpose of a Matrix) 是线性代数中的一个基本概念,它涉及到改变矩阵的行和列的位置,从而形成一个新的矩阵。下面是关于矩阵转置的详细介绍。
对于一个
m
×
n
m \times n
m×n的矩阵
A
A
A,其转置矩阵==
A
T
A^T
AT==(有时也记作
A
′
A'
A′或
A
⊤
A^\top
A⊤,Python代码为A.T
)是一个
n
×
m
n \times m
n×m的矩阵,其中
A
T
A^T
AT的第
i
i
i行第
j
j
j列的元素等于
A
A
A的第
j
j
j行第
i
i
i列的元素。形式上,如果
A
=
[
a
i
j
]
A = [a_{ij}]
A=[aij],那么
A
T
=
[
a
j
i
]
A^T = [a_{ji}]
AT=[aji]。
示例
假设我们有一个
3
×
2
3 \times 2
3×2的矩阵
A
A
A:
A
=
(
a
11
a
12
a
21
a
22
a
31
a
32
)
A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ a_{31} & a_{32} \end{pmatrix}
A=
a11a21a31a12a22a32
那么 A A A的转置 A T A^T AT是一个 2 × 3 2 \times 3 2×3的矩阵:
A T = ( a 11 a 21 a 31 a 12 a 22 a 32 ) A^T = \begin{pmatrix} a_{11} & a_{21} & a_{31} \\ a_{12} & a_{22} & a_{32} \end{pmatrix} AT=(a11a12a21a22a31a32)
性质
矩阵的转置具有以下性质:
- 自反性:转置的转置等于原来的矩阵,即 ( A T ) T = A (A^T)^T = A (AT)T=A。
- 线性:转置运算保持加法和标量乘法,即 ( A + B ) T = A T + B T (A + B)^T = A^T + B^T (A+B)T=AT+BT和 ( c A ) T = c A T (cA)^T = cA^T (cA)T=cAT,其中 c c c是标量。
- 乘法:矩阵乘法的转置等于转置矩阵的乘法的逆序,即 ( A B ) T = B T A T (AB)^T = B^T A^T (AB)T=BTAT。注意乘法的顺序是相反的。
- 幂次:如果 A A A是方阵,那么 ( A n ) T = ( A T ) n (A^n)^T = (A^T)^n (An)T=(AT)n。
- 单位矩阵:单位矩阵的转置还是单位矩阵,即 I T = I I^T = I IT=I。
- 对称矩阵:如果一个矩阵等于其转置,即 A = A T A = A^T A=AT,那么这个矩阵是对称矩阵。
- 反对称矩阵:如果一个矩阵等于其转置的负矩阵,即 A = − A T A = -A^T A=−AT,那么这个矩阵是反对称矩阵。
应用
矩阵转置在许多数学和工程领域中都有广泛应用,包括但不限于:
- 线性代数:在求解线性方程组、矩阵乘法和特征值问题时,转置操作是非常基础的。
- 优化理论:在最优化问题中,转置用于处理梯度和雅可比矩阵。
- 统计学:在多元统计分析中,转置用于处理协方差矩阵和相关矩阵。
- 计算机图形学:在三维图形变换中,转置用于处理坐标系的变换。
- 机器学习:在特征向量和协方差矩阵的计算中,转置是一个常用的操作。
总结
矩阵的转置是一个基本的线性代数概念,它通过交换矩阵的行和列来形成一个新的矩阵。这一操作在理论证明和实际应用中都非常常见,是理解和操作矩阵的关键工具之一。
3.2 对称矩阵(Symmetric Matrix)
定义
对称矩阵(Symmetric Matrix) 是线性代数中的一个重要概念,它专门针对 实数矩阵 ,并具有独特的性质和应用。
一个 n × n n \times n n×n的方阵 A A A被称为对称矩阵,如果它等于自己的转置:
A = A T A = A^T A=AT
其中 A T A^T AT表示矩阵 A A A的转置,即矩阵的行和列互换后的矩阵。形式上,对于矩阵 A A A的元素 a i j a_{ij} aij,如果满足 a i j = a j i a_{ij} = a_{ji} aij=aji对所有 i , j i, j i,j成立,则 A A A是对称的。
示例
一个简单的对称矩阵的例子是:
A
=
(
1
2
3
2
4
5
3
5
6
)
A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{pmatrix}
A=
123245356
在这个例子中,
A
A
A的元素满足
a
i
j
=
a
j
i
a_{ij} = a_{ji}
aij=aji,因此
A
A
A是对称的。
性质
对称矩阵具有一些重要的性质:
- 特征值:对称矩阵的 所有特征值都是实数 。这意味着不存在复数特征值。
- 特征向量:属于不同特征值的特征向量是正交的。也就是说,如果 v 1 v_1 v1和 v 2 v_2 v2是对称矩阵 A A A的对应于不同特征值 λ 1 \lambda_1 λ1和 λ 2 \lambda_2 λ2的特征向量,则 v 1 v_1 v1和 v 2 v_2 v2正交(即 v 1 T v 2 = 0 v_1^T v_2 = 0 v1Tv2=0 )。
- 正交对角化:对称矩阵可以被正交对角化 ,即存在一个正交矩阵 P P P(其列向量为 A A A的特征向量),使得 P T A P = D P^T A P = D PTAP=D,其中 D D D是一个对角矩阵,对角线上的元素是 A A A的特征值。
- 正定性:如果一个对称矩阵 A A A的 所有特征值都是正的 ,则称 A A A是正定的。正定矩阵有许多良好的性质,例如,对于任何非零向量 x x x,有 x T A x > 0 x^T A x > 0 xTAx>0。
应用
对称矩阵在许多领域都有重要的应用,包括但不限于:
- 优化理论:在凸优化中,正定对称矩阵对应于二次函数的正定性,这对于寻找全局最小值至关重要。
- 图论:邻接矩阵和拉普拉斯矩阵是对称矩阵,它们在图的分析中扮演重要角色。
- 统计学:协方差矩阵是对称的,用于描述随机变量之间的关系。
- 物理学:在量子力学中,对称矩阵(实际上是埃尔米特矩阵)用于描述物理系统的可观测量。
总结
对称矩阵因其优良的性质而在数学和工程领域中占有重要地位。它们的特征值和特征向量的性质使得它们在理论和实际应用中都非常有用。对称矩阵的正交对角化能力使得它们在许多计算任务中能够简化问题,提高效率。
3.3 埃尔米特矩阵(Hermitian matrix)
定义
埃尔米特矩阵(Hermitian matrix) ,也称为自伴矩阵,是一个 复数方阵 ,满足其共轭转置等于自身:
A = A H A = A^H A=AH ,其中 A H A^H AH表示矩阵 A A A的共轭转置。
其中 A H A^H AH表示矩阵 A A A的共轭转置(即先取转置再取每个元素的复共轭)。
示例
一个简单的2×2埃尔米特矩阵的例子可以写成:
A
=
[
a
b
+
c
i
b
−
c
i
d
]
A = \begin{bmatrix} a & b + ci \\ b - ci & d \\ \end{bmatrix}
A=[ab−cib+cid]
这里, a a a, b b b, c c c, 和 d d d都是实数。矩阵的对角线元素必须是实数,并且非对角线元素的上半部分和下半部分是对称的共轭复数。
作为一个具体的例子,考虑以下2×2的埃尔米特矩阵:
A
=
[
2
1
+
3
i
1
−
3
i
4
]
A = \begin{bmatrix} 2 & 1 + 3i \\ 1 - 3i & 4 \\ \end{bmatrix}
A=[21−3i1+3i4]
在这个例子中, a = 2 a = 2 a=2和 d = 4 d = 4 d=4是实数,而 ( 1 + 3 i ) (1 + 3i) (1+3i)和 ( 1 − 3 i ) (1 - 3i) (1−3i)是共轭对。
性质
埃尔米特矩阵具有以下性质:
- 对称性:对于实数矩阵来说,埃尔米特矩阵就是对称矩阵。
- 特征值:埃尔米特矩阵的 所有特征值都是实数 。
- 特征向量:不同特征值对应的特征向量正交。也就是说,如果 v 1 v_1 v1和 v 2 v_2 v2是对称矩阵 A A A的对应于不同特征值 λ 1 \lambda_1 λ1和 λ 2 \lambda_2 λ2的特征向量,则 v 1 v_1 v1和 v 2 v_2 v2正交(即 v 1 T v 2 = 0 v_1^T v_2 = 0 v1Tv2=0 )。
- 酉对角化:埃尔米特矩阵可以被酉对角化,即存在一个酉矩阵 U U U(其列向量为 A A A的特征向量),使得 U H A U = D U^H A U = D UHAU=D,其中 D D D是一个对角矩阵,对角线上的元素是 A A A的特征值。
- 正定性:如果一个埃尔米特矩阵的所有特征值都是正的,则称该矩阵为正定矩阵。正定矩阵有许多良好的性质,例如,对于任何非零向量 x x x,有 x T A x > 0 x^T A x > 0 xTAx>0 。
总结
埃尔米特矩阵有一些重要的性质,比如 它们的特征值总是实数,它们的特征向量可以选为正交的 ,而且任何有限维的复向量空间上的线性算子都可以表示为一个埃尔米特矩阵。
3.4 对称矩阵(Symmetric Matrix)vs. 埃尔米特矩阵(Hermitian matrix)
对称矩阵(Symmetric Matrix)和埃尔米特矩阵(Hermitian Matrix)都是线性代数中重要的矩阵类型,它们各自具有独特的性质和应用。以下是这两种矩阵的对比:
相同点
- 特征值:对称矩阵和埃尔米特矩阵的所有特征值都是实数。
- 特征向量:对于不同特征值的特征向量,它们都是正交的。
- 对角化:都可以通过对角化操作将其转换为对角矩阵形式。
不同点
- 定义域:对称矩阵限定于实数矩阵,而埃尔米特矩阵适用于复数矩阵。
- 转置操作:对称矩阵只需要转置即可,而埃尔米特矩阵需要共轭转置。
- 对角化矩阵:对称矩阵可以被正交矩阵对角化,而埃尔米特矩阵可以被酉矩阵对角化。
应用
- 对称矩阵:在实数域中,对称矩阵广泛应用于线性代数、优化理论、统计学等领域。
- 埃尔米特矩阵:在复数域中,埃尔米特矩阵应用于量子力学、信号处理等领域。
总结
对称矩阵和埃尔米特矩阵都是在线性代数中具有重要意义的矩阵类型。对称矩阵适用于实数矩阵,而埃尔米特矩阵适用于复数矩阵。它们共享许多相似的性质,但由于定义域的不同,它们在实际应用中有所区别。理解这两种矩阵的区别有助于正确地选择和使用适当的工具来解决特定问题。
3.5 埃尔米特矩阵(Hermitian matrix)vs. 酉矩阵(Unitary Matrix)
关系
- 相似性:埃尔米特矩阵和酉矩阵都是复数矩阵,但它们描述的是不同的性质。
- 酉矩阵的性质:酉矩阵可以看作是复数域中的正交矩阵,它保持了向量的长度和角度。
- 埃尔米特矩阵的性质:埃尔米特矩阵在复数域中类似于实数域中的对称矩阵,其特征值为实数,并且不同特征值对应的特征向量正交。
应用
- 埃尔米特矩阵:在量子力学中,埃尔米特矩阵用来表示可观测量。
- 酉矩阵:在量子力学、信号处理等领域中,酉矩阵用来表示旋转或其他保持范数的变换。
总结
虽然埃尔米特矩阵和酉矩阵都是复数矩阵,但它们描述的是不同的性质。埃尔米特矩阵强调的是矩阵与其共轭转置之间的关系,而酉矩阵强调的是矩阵与其共轭转置的乘积为单位矩阵。在实际应用中,根据具体的上下文选择适当的矩阵类型。
4.矩阵的凸性
4.1 正定矩阵(Positive Definite Matrix)
定义
正定矩阵(Positive Definite Matrix) 源于对矩阵性质的研究,尤其是对二次型的研究。二次型是一种特殊的多项式,它只包含变量的二次项及其组合。在数学中,二次型可以通过矩阵的形式来表示,而正定矩阵保证了二次型在非零向量上的取值总是正的。
一个
n
×
n
n \times n
n×n的实对称矩阵
A
A
A被称为正定矩阵,如果以下条件成立:
对于所有非零向量
x
∈
R
n
\mathbf{x} \in \mathbb{R}^n
x∈Rn,都有
x
T
A
x
>
0
x^T A x > 0
xTAx>0
这意味着矩阵 A A A作用于任何非零向量 x x x后,所得向量与 x x x的内积总是大于零。对于复数矩阵,定义类似,但使用共轭转置 x H x^H xH替代转置 x T x^T xT。
示例
下面给出一个2×2正定矩阵的例子:
A
=
[
2
−
1
−
1
2
]
A = \begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix}
A=[2−1−12]
验证 A A A是否为正定矩阵的一种方法是检查它的特征值是否全部大于零。计算 A A A的特征值,可以通过解特征多项式 det ( A − λ I ) = 0 \text{det}(A - \lambda I) = 0 det(A−λI)=0得到:
det ( [ 2 − λ − 1 − 1 2 − λ ] ) = ( 2 − λ ) 2 − ( − 1 ) ( − 1 ) = λ 2 − 4 λ + 3 \text{det}\left(\begin{bmatrix} 2 - \lambda & -1 \\ -1 & 2 - \lambda \end{bmatrix}\right) = (2 - \lambda)^2 - (-1)(-1) = \lambda^2 - 4\lambda + 3 det([2−λ−1−12−λ])=(2−λ)2−(−1)(−1)=λ2−4λ+3
解这个二次方程 λ 2 − 4 λ + 3 = 0 \lambda^2 - 4\lambda + 3 = 0 λ2−4λ+3=0,得到特征值 λ 1 = 1 \lambda_1 = 1 λ1=1和 λ 2 = 3 \lambda_2 = 3 λ2=3,两者都是正数,因此矩阵 A A A是正定的。
另一个3×3的正定矩阵的例子可以是:
B = [ 2 − 1 0 − 1 2 − 1 0 − 1 2 ] B = \begin{bmatrix} 2 & -1 & 0 \\ -1 & 2 & -1 \\ 0 & -1 & 2 \end{bmatrix} B= 2−10−12−10−12
同样地,可以通过检查 B B B的特征值来验证它是否正定。由于 B B B是一个三阶矩阵,它的特征多项式会更高阶,但是我们可以通过数值方法或解析方法来找出它的特征值。如果所有特征值均为正,则 B B B也是正定的。
对于较小的矩阵,手动计算特征值是可行的,但对于更大的矩阵,通常会使用数值软件或库来帮助计算特征值,以确认矩阵是否正定。
性质
正定矩阵具有以下一些重要性质:
- 特征值:正定矩阵的所有特征值都是正的。
- 特征向量:正定矩阵的特征向量可以构成一组正交基。
- 逆矩阵:正定矩阵一定是可逆的,且其逆矩阵也是正定的。
- 正交对角化:正定矩阵可以被正交对角化,即存在一个正交矩阵 P P P使得 P T A P = D P^T A P = D PTAP=D,其中 D D D是对角矩阵,对角线上的元素为 A A A的特征值。
- 行列式:正定矩阵的行列式大于零。
- 半正定矩阵:如果上述条件中的不等号为大于等于(即 x T A x ≥ 0 x^T A x \geq 0 xTAx≥0),则矩阵称为半正定矩阵。
几何意义
正定矩阵在几何上具有重要的意义,它描述了空间中的一种特殊的度量方式。具体来说:
- 椭圆:正定矩阵 A A A定义了一个椭圆面 x T A x = 1 x^T A x = 1 xTAx=1。对于任意非零向量 x x x, x T A x x^T A x xTAx总是正的,这意味着该椭圆面是凸的,并且不包含任何直线或平面。
- 内积:正定矩阵 A A A定义了一个新的内积 ⟨ x , y ⟩ A = x T A y \langle x, y \rangle_A = x^T A y ⟨x,y⟩A=xTAy ,这个内积保留了标准内积的一些性质,如对称性和正定性。
- 正交变换:正定矩阵可以通过正交变换对角化,这意味着它可以被看作是一个旋转(或反射)和一个正的尺度变换的组合。这在几何上意味着正定矩阵可以将一个单位球映射成一个椭球。
- 正定性与距离:在正定矩阵定义的空间中,两点之间的距离可以通过相应的正定矩阵来衡量,这使得正定矩阵在度量空间中具有重要意义。
诞生背景
-
线性代数中的稳定性:在研究线性变换时,正定矩阵提供了一种保证变换在某些方面是“良态”的方式。它们的性质确保了在进行线性变换时不会出现奇异或不稳定的情况。
-
数值分析中的优化:在数值分析中,正定矩阵与凸优化密切相关。在凸优化问题中,如果目标函数的Hessian矩阵是正定的,那么这个函数就是一个严格凸函数,这意味着它只有一个全局最小值,这对于寻找最优解是非常有利的。
应用
正定矩阵在许多领域都有广泛的应用,包括但不限于:
-
优化理论:在凸优化问题中,如果一个函数的二阶导数(或Hessian矩阵)是正定的,那么这个函数是严格凸的,这意味着它只有一个局部最小值,也就是全局最小值。这在很多优化问题中都是非常有用的性质。
-
统计学:在统计学中,协方差矩阵通常是正定的。这是因为协方差矩阵的正定性保证了数据分布的合理性,并且在多元高斯分布中,正定性保证了概率密度函数的正确性。
-
机器学习:在机器学习中,特别是在支持向量机(SVM)等算法中,核矩阵(Kernel matrix)常常要求是正定的。这保证了优化问题的解是唯一的,并且优化过程是稳定的。
-
数值线性代数:在数值线性代数中,正定矩阵常用于构造条件良好的数值算法,如共轭梯度法(Conjugate Gradient Method),这种方法特别适合解决大规模稀疏线性系统的正定情况下的问题。
-
控制理论:在控制理论中,正定矩阵与李雅普诺夫稳定性理论相关联。在分析系统的稳定性时,正定矩阵可以用来证明系统的平衡点是局部稳定甚至是全局稳定的。
-
信号处理:在信号处理中,自相关矩阵通常是正定的,这有助于信号的估计和检测。
-
金融工程:在金融工程中,资产收益率的协方差矩阵是正定的,这对于风险管理和资产配置至关重要。
总结
正定矩阵是线性代数中的一个重要概念,它不仅在理论上具有许多优良的性质,还在实际应用中发挥着重要作用。正定矩阵的几何意义在于它定义了一个凸的椭圆面,并且可以用作定义新的内积和度量的方式,从而在不同的领域中都有广泛的应用。
4.2 非正定矩阵(Non-positive Definite Matrix)
定义
非正定矩阵(Non-positive Definite Matrix) ,是指不满足正定矩阵条件的矩阵。
示例
例如,矩阵
A
=
[
−
1
0
0
−
2
]
A=\begin{bmatrix}-1 & 0\\0 & -2\end{bmatrix}
A=[−100−2]就是一个非正定矩阵。
对于任意非零向量 x = ( x 1 , x 2 ) x=(x_1,x_2) x=(x1,x2),计算 x T A x x^TAx xTAx: 设 x = ( x 1 , x 2 ) x=(x_1,x_2) x=(x1,x2),则 x T A x = [ x 1 x 2 ] [ − 1 0 0 − 2 ] [ x 1 x 2 ] = [ x 1 x 2 ] [ − x 1 − 2 x 2 ] = − x 1 2 − 2 x 2 2 ≤ 0 x^TAx=\begin{bmatrix}x_1&x_2\end{bmatrix}\begin{bmatrix}-1 & 0\\0 & -2\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}x_1&x_2\end{bmatrix}\begin{bmatrix}-x_1\\-2x_2\end{bmatrix}=-x_1^2 - 2x_2^2\leq0 xTAx=[x1x2][−100−2][x1x2]=[x1x2][−x1−2x2]=−x12−2x22≤0,
不满足对于任意非零向量 x x x, x T A x > 0 x^TAx>0 xTAx>0这个正定矩阵的条件。 所以矩阵 A A A是非正定矩阵。
4.3 埃尔米特正定带状矩阵(Hermitian positive-definite banded matrix)
埃尔米特正定带状矩阵(Hermitian positive-definite banded matrix)是一种特殊类型的矩阵,它既是埃尔米特矩阵(矩阵等于其共轭转置),又是正定矩阵(对于任意非零向量 x x x, x H A x > 0 x^H A x > 0 xHAx>0,其中 x H x^H xH是 x x x的共轭转置),同时还是带状矩阵(主对角线及其两边的若干条对角线上有非零元素,而其他位置的元素均为零)。 以下是一个简单的示例:
设一个 4 × 4 4\times4 4×4的三对角带状矩阵
A = [ 2 1 0 0 1 3 1 0 0 1 3 1 0 0 1 2 ] A=\begin{bmatrix} 2 & 1 & 0 & 0\\ 1 & 3 & 1 & 0\\ 0 & 1 & 3 & 1\\ 0 & 0 & 1 & 2 \end{bmatrix} A= 2100131001310012
这个矩阵是实对称矩阵,对于实对称矩阵来说,实对称就等同于埃尔米特性质。 为了验证它是正定矩阵,可以通过计算它的各阶顺序主子式来判断。
-
一阶顺序主子式为 2 > 0 2>0 2>0。
-
二阶顺序主子式为 ∣ 2 1 1 3 ∣ = 2 × 3 − 1 × 1 = 5 > 0 \begin{vmatrix} 2 & 1\\ 1 & 3 \end{vmatrix}=2\times3 - 1\times1 = 5>0 2113 =2×3−1×1=5>0
-
三阶顺序主子式为
∣ 2 1 0 1 3 1 0 1 3 ∣ = 2 × ∣ 3 1 1 3 ∣ − 1 × ∣ 1 1 0 3 ∣ + 0 × ∣ 1 3 0 1 ∣ = 2 × ( 3 × 3 − 1 × 1 ) − 1 × ( 1 × 3 − 0 × 1 ) = 16 > 0 \begin{vmatrix} 2 & 1 & 0\\ 1 & 3 & 1\\ 0 & 1 & 3 \end{vmatrix}=2\times\begin{vmatrix} 3 & 1\\ 1 & 3 \end{vmatrix}-1\times\begin{vmatrix} 1 & 1\\ 0 & 3 \end{vmatrix}+0\times\begin{vmatrix} 1 & 3\\ 0 & 1 \end{vmatrix}=2\times(3\times3 - 1\times1)-1\times(1\times3 - 0\times1)=16>0 210131013 =2× 3113 −1× 1013 +0× 1031 =2×(3×3−1×1)−1×(1×3−0×1)=16>0
- 四阶顺序主子式为矩阵 A A A的行列式
∣
2
1
0
0
1
3
1
0
0
1
3
1
0
0
1
2
∣
=
2
×
∣
3
1
0
1
3
1
0
1
2
∣
−
1
×
∣
1
1
0
0
3
1
0
1
2
∣
+
0
×
∣
1
3
1
0
1
2
0
0
1
∣
−
0
×
∣
1
3
0
0
1
1
0
0
2
∣
\begin{vmatrix} 2 & 1 & 0 & 0\\ 1 & 3 & 1 & 0\\ 0 & 1 & 3 & 1\\ 0 & 0 & 1 & 2 \end{vmatrix}=2\times\begin{vmatrix} 3 & 1 & 0\\ 1 & 3 & 1\\ 0 & 1 & 2 \end{vmatrix}-1\times\begin{vmatrix} 1 & 1 & 0\\ 0 & 3 & 1\\ 0 & 1 & 2 \end{vmatrix}+0\times\begin{vmatrix} 1 & 3 & 1\\ 0 & 1 & 2\\ 0 & 0 & 1 \end{vmatrix}-0\times\begin{vmatrix} 1 & 3 & 0\\ 0 & 1 & 1\\ 0 & 0 & 2 \end{vmatrix}
2100131001310012
=2×
310131012
−1×
100131012
+0×
100310121
−0×
100310012
逐步计算可得四阶顺序主子式也大于 0。 综上,这个矩阵是埃尔米特正定三对角带状矩阵。