1. 幺正矩阵(酉矩阵,unitary matrix)
1.1 定义
幺正矩阵是一个
n
×
n
n\times n
n×n的复数方块矩阵,满足以下性质:
U
∗
U
=
U
U
∗
=
I
n
U^*U=UU^*=I_n
U∗U=UU∗=In其中,
U
∗
U^*
U∗是
U
U
U的共轭转置,
I
n
I_n
In是
n
×
n
n\times n
n×n的单位矩阵。即幺正矩阵的逆矩阵就是其共轭转置
U
−
1
=
U
∗
U^{-1}=U^*
U−1=U∗幺正矩阵是实数上的正交矩阵在复数上的推广。
共轭转置(埃尔米特共轭,埃尔米特转置,Hermitian transpose): ( A ∗ ) i j = A j i ‾ (A^*)_{ij}=\overline{A_{ji}} (A∗)ij=Aji其中 ( ⋅ ) ‾ \overline{(\cdot)} (⋅)表示标量的复共轭,即 A ∗ = ( A ‾ ) T = A T ‾ A^*=(\overline{A})^T=\overline{A^T} A∗=(A)T=AT在线性代数中,也用 A H A^H AH表示共轭转置。在量子力学中,用 A † A^\dagger A†表示共轭转置,同时 A ∗ A^* A∗只表示 A A A的复数共轭,不做矩阵转置。
1.2 性质
- 酉矩阵 U U U与其共轭转置 U ∗ U^* U∗矩阵乘法可交换,是正规矩阵
- 酉矩阵必可逆,且逆矩阵等于其共轭转置矩阵
- 酉矩阵 U U U的所有特征值 λ n \lambda_n λn,都是绝对值等于1的复数: ∣ λ n ∣ = 1 |\lambda_n|=1 ∣λn∣=1;因此 U U U的行列式绝对值也为1: ∣ det ( U ) ∣ = 1 |\det(U)|=1 ∣det(U)∣=1
- 酉矩阵 U U U不会改变两个复向量 x \boldsymbol {x} x和 y \boldsymbol {y} y的点积: ( U x ) ⋅ ( U y ) = x ⋅ y (U_{\boldsymbol {x}})\cdot (U_{\boldsymbol {y}})=\boldsymbol {x}\cdot \boldsymbol {y} (Ux)⋅(Uy)=x⋅y;更一般地说,所有希尔伯特內积也不会改变: ⟨ U x , U y ⟩ = ⟨ x , y ⟩ \langle U_{\boldsymbol {x}},U_{\boldsymbol {y}}\rangle=\langle \boldsymbol {x},\boldsymbol {y}\rangle ⟨Ux,Uy⟩=⟨x,y⟩
- 若 U U U和 V V V都是酉矩阵,则 U V UV UV也是酉矩阵
1.3 幺正对角化(unitary diagonalization)
幺正对角化指把一个矩阵
A
A
A对角化成以下形式:
A
=
U
D
U
∗
A=UDU^*
A=UDU∗其中
U
U
U是酉矩阵,
D
D
D是对角矩阵。根据谱定理,一个矩阵
A
A
A可幺正对角化,当且仅当
A
A
A是正规矩阵。酉矩阵本身也可幺正对角化。
2. 埃尔米特矩阵(厄米特矩阵,厄米矩阵,Hermitian matrix,自伴随矩阵)
2.1 定义
埃尔米特矩阵是共轭对称的方阵,矩阵中每一个第
i
i
i行第
j
j
j列的元素都与第
j
j
j行第
i
i
i列的元素复共轭,即矩阵本身与其共轭转置相等。对于
A
=
{
a
i
,
j
}
∈
C
n
×
n
A=\{ a_{i,j} \}\in C^{n\times n}
A={ai,j}∈Cn×n有:
a
i
,
j
=
a
j
,
i
‾
a_{i,j}=\overline{a_{j,i}}
ai,j=aj,i记作
A
=
A
∗
A=A^*
A=A∗
斜埃尔米特矩阵(反埃尔米特矩阵): 矩阵本身与其共轭转置的相反数相等 A = − A ∗ A=-A^* A=−A∗
2.2 性质
- 埃尔米特矩阵主对角线上的元素都是实数,其特征值也是实数。实对称矩阵是埃尔米特矩阵的特例
- 斜埃尔米特矩阵主对角线上的元素都是纯虚数,其特征值也都是纯虚数
- 若 A A A和 B B B是埃尔米特矩阵,那么它们的和 A + B A+B A+B也是埃尔米特矩阵;而只有在 A A A和 B B B满足交换性(即 A B = B A AB = BA AB=BA)时,它们的积才是埃尔米特矩阵
- 可逆的埃尔米特矩阵 A A A的逆矩阵 A − 1 A^{-1} A−1仍然是埃尔米特矩阵
- 如果 A A A是埃尔米特矩阵,对于正整数 n n n, A n A^n An是埃尔米特矩阵
- 方阵 C C C与其共轭转置的和 C + C ∗ C+C^{*} C+C∗是埃尔米特矩阵
- 方阵 C C C与其共轭转置的差 C − C ∗ C-C^{*} C−C∗是斜埃尔米特矩阵
3. 正规矩阵(normal matrix)
3.1 定义
正规矩阵是与自己的共轭转置满足交换律的复系数方块矩阵,即矩阵
A
A
A满足:
A
∗
A
=
A
A
∗
A^*A=AA^*
A∗A=AA∗如果
A
A
A是实系数矩阵,则
A
∗
=
A
T
A^*=A^T
A∗=AT,条件化简为:
A
T
A
=
A
A
T
A^TA=AA^T
ATA=AAT
3.2 性质
- 任何一个正规矩阵,都是某个正规算子在一组标准正交基下的矩阵。反之,任一正规算子在一组标准正交基下的矩阵都为正规矩阵
- 任一正规矩阵都可在经过一个酉变换后变为对角矩阵。反之,所有可在经过一个酉变换后变为对角矩阵的矩阵都是正规矩阵
- 在复系数矩阵中,所有酉矩阵、埃尔米特矩阵、斜埃尔米特矩阵都是正规的。同理,在实系数矩阵中,所有正交矩阵、对称矩阵、斜对称矩阵都是正规的
- 两个正规矩阵的乘积不一定是正规矩阵
- 如果 A A A既是三角矩阵又是正规矩阵,那么 A A A是对角矩阵
- 即使 A A A不是方块矩阵, A ∗ A A^*A A∗A和 A A ∗ AA^* AA∗仍然是埃尔米特矩阵和半正定矩阵
4. 正定矩阵(positive definite matrix)
4.1 定义
- 实数定义:一个 n × n n\times n n×n的实对称矩阵 M M M是正定的,当且仅当对所有的非零实系数向量 z ∈ R n z\in \Bbb{R}^n z∈Rn,都有 z T M z > 0 z^TMz>0 zTMz>0
- 复数定义:一个 n × n n\times n n×n的埃尔米特矩阵 M M M是正定的,当且仅当对所有的非零复向量 z ∈ R n z\in \Bbb{R}^n z∈Rn,都有 z ∗ M z > 0 z^*Mz>0 z∗Mz>0,其中 z ∗ M z z^*Mz z∗Mz必然是实数
- 负定矩阵(negative definite matrix): z ∗ M z < 0 z^*Mz<0 z∗Mz<0
- 半正定矩阵(positive semi-definite matrix): z ∗ M z ≥ 0 z^*Mz\ge 0 z∗Mz≥0
- 半负定矩阵(negative semi-definite matrix): z ∗ M z ≤ 0 z^*Mz\le 0 z∗Mz≤0
- 如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称之为不定矩阵(indefinite matrix)
4.2 判别正定阵
对
n
×
n
n\times n
n×n的埃尔米特矩阵
M
M
M,以下性质与“
M
M
M为正定阵”等价:
- 矩阵 M M M的所有特征值 λ i \lambda_i λi都是正的
- 半双线性形式 ⟨ x , y ⟩ = x ∗ M y \langle \boldsymbol {x},\boldsymbol {y}\rangle=\boldsymbol {x}^*M\boldsymbol {y} ⟨x,y⟩=x∗My定义了一个 C n \boldsymbol {C}^n Cn上的内积
5. 相似矩阵(similar matrix)
5.1 定义
两个系数域为
K
K
K的
n
×
n
n×n
n×n的矩阵
A
A
A与
B
B
B为域
L
L
L上的相似矩阵,当且仅当存在一个系数域为
L
L
L的
n
×
n
n×n
n×n的可逆矩阵
P
P
P,使得:
P
−
1
A
P
=
B
P
−
1
A
P
=
B
{P^{-1}AP=B}\!P^{{-1}}AP=B
P−1AP=BP−1AP=B此时,称矩阵
A
A
A与
B
B
B“相似”。
B
B
B称作
A
A
A通过相似变换矩阵
P
P
P得到的矩阵。术语相似变换的其中一个含义就是将矩阵
A
A
A变成与其相似的矩阵
B
B
B。
两个相似的矩阵可以看做是同一个线性变换的“两面”,即在两个不同的基下的表现。在给定了矩阵
A
A
A后,只要能找到一个与之相似而又足够“简单”的“规范形式”
B
B
B,那么对
A
A
A的研究就可以转化为对更简单的矩阵
B
B
B的研究。
5.2 性质
- 矩阵间的相似关系与所在的域无关:设 K K K是 L L L的一个子域, A A A和 B B B是两个系数在 K K K中的矩阵,则 A A A和 B B B在 K K K上相似当且仅当它们在 L L L上相似
- 两个相似矩阵的秩、行列式值、迹数相等
- 两个相似矩阵具有相同的特征值、特征多项式、初等因子
6. 合同矩阵
6.1 定义
两个矩阵
A
A
A和
B
B
B是合同的,如果有同数域上的可逆矩阵
P
P
P,使得
A
=
P
T
B
P
A=P^TBP
A=PTBP对于二次型的矩阵表示来说,做一次非退化的线性替换相当于将二次型的矩阵变为一个与其合同的矩阵。
在实数域中,根据惯性定理,每个对称矩阵都合同于一个对角线上元素只由
0
0
0和
±
1
\pm1
±1构成的对角矩阵。如果设1的个数是
p
p
p,
−
1
-1
−1的个数是
q
q
q,那么给定
(
p
,
q
)
(p,q)
(p,q)后,就确定了一个关于合同关系的等价类。数对
(
p
,
q
)
(p,q)
(p,q)称为一个对称矩阵(或相应二次型)的惯性指数。其中
1
1
1的个数
p
p
p称为正惯性指数,
−
1
-1
−1的个数
q
q
q称为负惯性指数,
p
−
q
p-q
p−q叫做符号差。据此可以得出:合同关系将所有的对称矩阵分为
(
n
+
2
)
(
n
+
1
)
2
{(n+2)(n+1) \over 2}
2(n+2)(n+1)个等价类。
如果不考虑替换矩阵的正交性,那么在复数域中,每个对称矩阵都合同于一个对角线上元素只由
0
0
0和
1
1
1构成的对角矩阵。对角线上的
1
1
1的个数等于原来的矩阵的秩。因此每个可逆的对称矩阵都合同于单位矩阵。
6.2 性质
- 合同类矩阵具有相等的秩和正惯性指数
- 每个二次型都可以经过线性替换变成若干个平方和的形式,对于矩阵来说,就是每个对称矩阵都合同于一个对角矩阵
6.3 正定二次型
如果
∀
α
∈
R
n
{\textstyle \forall \alpha \in \mathbb {R} ^{n}}
∀α∈Rn,且
α
≠
0
{\textstyle \alpha \neq 0}
α=0,都有
α
′
A
α
≥
0
{\textstyle \alpha ^{'}A\alpha \geq 0}
α′Aα≥0,那么这个二次型被称为半正定的,它对应的对称矩阵在实数域内合同到一个一个对角线上元素只由
0
0
0和
1
1
1构成的对角矩阵。
如果一个二次型的矩阵在实数域内合同于单位矩阵,那么称其为正定二次型。一个二次型是半正定二次型当且仅当它的正惯性指数等于它对应的矩阵的秩;是正定二次型当且仅当它的正惯性指数是
n
n
n。 正定二次型必然是可逆矩阵,而且它的顺序主子式全部大于
0
0
0。
同样的可以定义半负定、负定和不定的二次型。
7. 等价矩阵
7.1 定义
假设有两个
m
×
n
m\times n
m×n的矩阵,记作
A
A
A和
B
B
B。它们之间等价当且仅当存在两个可逆的方块矩阵:
n
×
n
n\times n
n×n的矩阵
P
P
P以及
m
×
m
m\times m
m×m的矩阵
Q
Q
Q,使得
A
=
Q
B
P
{\displaystyle \mathbf {A} =\mathbf {QBP} }
A=QBP这时称两个矩阵
A
A
A和
B
B
B是等价矩阵。相似矩阵一定是等价矩阵,等价的矩阵不一定是相似的。
7.2 性质
- 两个矩阵等价当且仅当:① 其中一者能够经过若干次初等行或列变换变成另一者;② 它们有相同的秩