数学笔记(四)线性代数知识点总结

最新推荐文章于 2025-02-10 18:05:59 发布

ZeitHaum

最新推荐文章于 2025-02-10 18:05:59 发布

阅读量1.3k

点赞数 2

分类专栏：笔记文章标签：数学线性代数

本文链接：https://blog.csdn.net/m0_51153423/article/details/119580047

版权

笔记专栏收录该内容

9 篇文章

订阅专栏

写在最前面:本文是阅读《Quantum Computation and Quantum Information》时所做，作者之前略微学过线性代数，但了解不深，阅读第二章第一节线性代数部分时遇到了很多困难，今将学习笔记发布给大家参阅，若有疏漏欢迎理性讨论，希望能给大家带来一点启发。

[2.1.2] (这是书上的相关内容的对应章节)

1.线性算子与矩阵表示的转换：

1.1 一般情况

线性算子本身与坐标系无关，但要将其矩阵联系起来，需要建立坐标系，而建立坐标系首先要确定基。

给定输入基 $|v_i\rangle$ 和输出基 $|w_i\rangle$ ,则有以下确定线性变换的矩阵表示的两种方法：

(1).直接变换法：

设线性算子 $A$ 有映射关系 $A|v_j\rangle=|w\rangle=\displaystyle\sum_iA_{ij}|w_i\rangle$ ，则用于线性表示 $|w\rangle$ 的系数 $A_{ij}$ 即为表示线性算子的矩阵的第 $i$ 行第 $j$ 列。

(2).外积计算法：

在(1)的基础下，如果 $|w_i \rangle$ 和 $|v_i\rangle$ 是两组标准正交基时，

由完备性关系: $I_WAI_V=\displaystyle \sum_{ij} |w_i\rangle\langle w_i|A|v_j\rangle\langle v_i| = \displaystyle \sum_i \langle w_i|A|v_j\rangle |w_i\rangle\ \langle v_i|$

可以证明，$A_{ji} = \langle w_i|A|v_j\rangle $,$ A_{ji} $表示$ A $的矩阵的第$ j $行第$ i$列的元素。

1.2 过渡矩阵

在1.1的情况下,若线性算子 $A$ 是这么一个矩阵: $A|v_i\rangle = |w_i\rangle$ ，即 $A$ 将一组基一一映射到另一组基，称 $A$ 的矩阵表示为过渡矩阵.

可以证明，当 $|w_i \rangle$ 和$|v_i\rangle $是两组标准正交基时，过渡矩阵可以这样得到：

$\displaystyle \sum_i|w_i\rangle\langle v_i|$

1.3恒等算子

恒等算子 $I$ 定义为 $I|v\rangle \equiv |v\rangle$ .在输入基和输出基相同的情况下， $I$ 的矩阵表示可以为 $E$ （即单位矩阵，除对角线全为1外其余均为0）.

1.4二维复向量空间上的重要的外积：

$|0\rangle\langle0| = \left[ \begin{matrix}1&0\\0&0\end{matrix}\right ]$

$|0\rangle\langle1| = \left[ \begin{matrix}0&1\\0&0\end{matrix}\right ]$

$|1\rangle\langle0| = \left[ \begin{matrix}0&0\\1&0\end{matrix}\right ]$

$|1\rangle\langle1| = \left[ \begin{matrix}0&0\\0&1\end{matrix}\right ]$

[2.1.4]

2.内积

Hilbert空间定义内积应满足三个条件：

(1).线性性质: $(|v\rangle,\displaystyle \sum_{i}\lambda_i|w_i\rangle) =\displaystyle \sum_{i}\lambda_i(|v\rangle,|w_i\rangle).$

(2).交换共轭： $(|v\rangle,|w\rangle) = (|w\rangle,|v\rangle)^{*}.$

(3).非负性： $(|v\rangle,|v\rangle)\geq0.$

3.Gram-Schmidt 正交化递推公式：

(1). $|v_1\rangle = |w_1\rangle$

(2). $|v_{k+1}\rangle = \frac{|w_{k+1}\rangle - \displaystyle \sum_{i=1}^{k}\langle v_i|w_{k+1}\rangle|v_i\rangle}{||\ |w_{k+1}\rangle - \displaystyle \sum_{i=1}^{k}\langle v_i|w_{k+1}\rangle|v_i\rangle||}$ ,(注意后面只有 $k$ 项.)

[2.1.5]

4.特征值与特征向量

4.1定义

一个特征值可以对应无数个特征向量，这些特征向量组成了特征值 $\lambda$ 的本征空间。

4.2特征值的性质:

对于任意矩阵 $A$ ,有 $A^n|v\rangle = \lambda^n|v\rangle.$ 其中 $|v\rangle$ 是特征值 $\lambda$ 所对应的特征向量.

4.3Pauli矩阵的特征值

除了 $I$ 的特征值为1外，其余都是 $\pm1$ 。

关于各种特殊矩阵的特征值与特征向量将在后续文章中给出。

5.对角表示：

已知矩阵 $A$ 的特征值是 $\lambda_i$ ， $\lambda_i$ 对应的特征向量分别为 $|v_i\rangle$ (重根要列出 $\lambda_i$ 的本征空间的一组最大线性无关组),将 $|v_i\rangle$ 标准正交化，得到向量 $|i\rangle$ .

如果矩阵 $A$ 可以表示为 $\displaystyle \sum_i\lambda_i|i\rangle\langle i|$ 的形式，则称 $A$ 可对角化。

可以证明, 此时向量 $|i\rangle$ 仍是 $A$ 的特征向量.

可以证明， $A$ 可以对角化的充要条件是 $A$ 是正规(normal)的。

[2.1.6]

6.伴随算子

$A$ 的伴随算子的矩阵表示是 $A$ 的矩阵表示的自共轭矩阵.记为 $A^{\dagger}$ .且伴随算子有关系:[定义式]

$(|v\rangle,A|w\rangle) = (A^{\dagger}|v\rangle,|w\rangle).$

伴随矩阵性质:

$(1)$ . $(A^{\dagger})^{\dagger} = A$

$(2)$ . $(\langle v|w\rangle)^{\dagger} = (\langle v|w\rangle)^{*}$

$(3)$ . $(|v\rangle\langle w|)^{\dagger} =(|w\rangle\langle v|)$

$(4)$ . $(A_1A_2...A_n)^{\dagger} = A_n^{\dagger}A_{n-1}^{\dagger}...A_1^{\dagger}$

$(5)$ . $\left[\begin{matrix}A&B\\C&D\end{matrix}\right]^{\dagger} =$ $\left[\begin{matrix}{A^{\dagger}}& {C^{\dagger}}\\ {B^{\dagger}}& {D^{\dagger}}\end{matrix}\right]$ (分块矩阵)

8.正规矩阵和Hermite矩阵

对于线性算子 $A$ ,如果 $AA^{\dagger} =A^{\dagger}A$ ,则称 $A$ 是正规算子,其矩阵表示称为正规矩阵.

正规矩阵性质：一个矩阵是正规矩阵当且仅当它可以对角表示。

对于线性算子 $A$ ,如果 $A^{\dagger} =A$ ,则称 $A$ 是Hermite算子,其矩阵表示称为Hermite矩阵.

正规矩阵与Hermite矩阵的关系:一个正规矩阵是Hermite的，当且仅当它的特征值全是实数。

Hermite矩阵性质:

$(1) .$ Hermite的特征值都是实数.

$(2) .$ Hermite矩阵的具有不同特征值的特征向量必须正交.[证明考虑 $\langle v|A|w\rangle$ 及其伴随矩阵]

$(3) .$ 对于任意一个矩阵 $A$ 都可以分解为 $A = B + i C$ ,其中 $\frac{1}{2}(A+A^{\dagger}),C = \frac{1}{2i}(A-A^{\dagger})$ ，且 $B, C$ 都是Hermite矩阵。

9.酉算子

对于线性算子 $U$ ,如果 $UU^{\dagger} =U^{\dagger}U = I$ ,则称 $U$ 是酉算子,其矩阵表示称为酉矩阵.

酉矩阵的性质:

$(1) .$ 酉矩阵是正规矩阵。

$(2).(|v\rangle,\langle w|) = (U|v\rangle,U\langle w|)$

$(3)$ .酉矩阵的特征值模都是1.

$(4) .$ 酉矩阵都是过渡矩阵，即存在两组标准正交基 $|w_i \rangle$ 和$|v_i\rangle $ ，使得$ U = \displaystyle \sum_i|w_i\rangle\langle v_i|$.[可利用酉矩阵的性质2证明]

$(5) .$ 酉矩阵的乘积也是酉矩阵。[通过性质4很好证明]

10.投影算子:

10.1定义

设线性空间 $V$ 的一组标准正交基为 $|1\rangle,|2\rangle...|d\rangle$ ,从中选取 $k(k\leq d)$ 个向量，定义具有形如 $P\equiv \displaystyle \sum_{i=1}^{k}|i\rangle\langle i|$ 的矩阵称为投影矩阵.

其对应的线性算子称为投影(projection)算子。

10.2投影算子的意义

根据此，设 $M$ 是 $V$ 到 $V$ 的正规算子，有 $=QM^{\dagger}P= 0$ .

10.3****投影算子的性质：

$(1) .$ 投影算子都是Hermite矩阵.

$(2) .$ 投影算子的特征值都是非0即1.

$(3) .$ 投影算子是幂等矩阵。

$(4)$ .正规算子 $M$ 是投影算子的充要条件为 $M^2=M$ .

11.半正定算子

11.1 定义

对于任意向量 $|v\rangle$ ，如果有 $\langle v|A|v\rangle \geq0$ ，则称A为半正定(positive)算子.

对于任意向量 $|v\rangle$ ，如果有 $\langle v|A|v\rangle >0$ ，则称A为正定(positive definite)算子.

本文主要研究半正定算子。

11.2性质

$(1) .$ 特征值非负。

$(2) .$ $\sqrt{P^2} =P$ [证明参见13算子函数的定义]

$(3) .$ 必定是Hermite算子。[证明参见Hermite的性质3]

$(4)$ .对于任意线性算子 $A$ , $A^{\dagger}A$ 和 $AA^{\dagger}$ 是半正定的.[考虑整体 $A|v\rangle$ ]

[2.1.7]

12.张量积

12.1张量积的计算公式:

$A\otimes B = \left[\begin{matrix}A_{11}B&A_{12}B&...&A_{1n}B\\A_{21}B&A_{22}B&...&A_{2n}B\\\vdots &\vdots&\vdots&\vdots\\A_{m1}B&A_{m2}B&...&A_{mn}B\end{matrix}\right]$

若 $A$ 是 $m\times n$ 矩阵， $B$ 是 $p\times q$ 矩阵，则 $A\otimes B$ 是 $mp\times nq$ 矩阵.

12.2张量积的意义：

设线性空间 $V$ 是 $|v\rangle$ 的集合， $W$ 是 $|w\rangle$ 的集合，则定义 $V\otimes W$ 是 $|v\rangle \otimes|w\rangle$ 及其线性组合的集合。

可以证明，集合 $V\otimes W=\{|v_i\rangle\otimes|w_j\rangle |\ |v\rangle\in V,|w\rangle \in W\}$

可以证明, 若 $|i\rangle$ 是 $V$ 的基向量， $|j\rangle$ 是 $W$ 的基向量，则 $|i\rangle\otimes|j\rangle$ 是 $V\otimes W$ 的基向量.

12.3张量积的性质：

$(1) .$ 张量积对于运算 $^*,\ ^T,\ ^{\dagger}$ 都是可分配的.

即 $(A\otimes B)^* = A^*\otimes B^*,(A\otimes B)^T = A^T\otimes B^T,(A\otimes B)^{\dagger} = A^{\dagger}\otimes B^{\dagger}.$

$(2) .$ 线性性质： $\otimes C = k(A\otimes C)+u(B\otimes C)$ .

$(3) .$ 乘法性质: $(A\otimes B)(C\otimes D) = AC\otimes BD$

$(4) .$ 若 $A, B$ 都是酉的，则 $A\otimes B$ 也是酉的。这条性质可以推广到(半)正定算子，投影算子,Hermite算子,正规算子.
[2.1.8]
13.算子函数

若 $f$ 是一个复数域上的映射，在正规矩阵 $\displaystyle \sum_{i}a|i\rangle\langle i|$ 上可定义算子函数 $\equiv \displaystyle \sum_{i}f(a)|i\rangle\langle i|.$

14.矩阵的迹

14.1 定义

矩阵的迹是这样一个函数： $\displaystyle \sum_{i}A_{ii}$ 即矩阵的对角线元素之和。

容易证明，Pauli矩阵的迹都是0.

14.2性质

$(1) .$ 线性性质： $t r (k A + u B) = k t r (A) + u t r (B)$

$(2) .$ 循环性质: $t r (A B) = t r (B A)$ [证明考虑矩阵展开]

15.1 定义式

对易式 $[A, B] = A B - B A$

反对易式 ${A,B\} = AB+BA$

如果 $[A, B] = 0$ ，称 $A$ 与 $B$ 是可对易的.

15.2性质

$(1) .$ $\frac{1}{2}([A,B]+\{A,B\})$

$(2)$ . $[A, B] = - [B, A]$

$(3) .$ $[A,B]^{\dagger} = [B^{\dagger},A^{\dagger}]$

15.3 任意Pauli矩阵的乘积

定义三元函数 $\varepsilon_{jkl}$ :

当 $j k l$ 中有相同的元素，返回 $0$ .

当 $j k l$ 各不相同且 $j k l$ 的逆序数为偶数，返回 $1$ .

当 $j k l$ 各不相同且 $j k l$ 的逆序为奇数，返回 $- 1$ .

可以验证，对于pauli矩阵：

$(1) .$ $\{\sigma_j,\sigma_k\} = 0$

$(2) .$ $[\sigma_j,\sigma_k] =2i\displaystyle \sum_{l=0}^{3}\varepsilon_{jkl}\sigma_l$

$(3) .$ $\sigma_i^2 = I$

根据以上三个条件，可以得到

$\sigma_j\sigma_k = \delta_{jk}I+\displaystyle i\sum_{l=0}^{3}\varepsilon_{jkl}\sigma_l.$
[2.1.10]
16.极式分解

分解步骤

对于任意矩阵 $A$ ,定义矩阵 $\sqrt{A^{\dagger}A}$

于是 $J$ 是一个半正定算子，可以进行谱分解为 $\displaystyle \sum_{i}\lambda_i|i\rangle\langle i|.$ $\lambda_i$ 是 $J$ 的特征向量。

只考虑不为0的 $\lambda_i$ ,

记 $|e_i\rangle = \frac{1}{\lambda_i}A|i\rangle$

将向量组 $|e_i\rangle$ 扩展为标准正交向量组，

记酉矩阵 $\displaystyle \sum_{i}|e_i\rangle\langle i|$

于是 $A|i\rangle = UJ|i\rangle$

故 $A$ 可以分解为 $U J$ .

称为 $A$ 的左极式分解.

同理易求出 $A$ 的右极式分解 $\sqrt{AA^{\dagger}}$

17.奇异值分解

17.1 相似对角化

对于正规矩阵 $A$ ,有谱分解 $\displaystyle \sum_{i}\lambda_i|i\rangle\langle i|$ ,

构造矩阵 $T$ ,使 $T$ 的第 $i$ 列是列向量 $|i\rangle$ .显然 $TT^{\dagger} = I$

构造矩阵 $D$ ,使得 $D_{ij} = \lambda_i\delta_{ij}.$

于是可以证明 $TDT^{-1} = TDT^{\dagger} = \displaystyle \sum_{i}\lambda_i|i\rangle\langle i| = A$

称 $D$ 为 $A$ 的相似标准型，这便是谱分解与相似对角化的关系。

17.2奇异值分解

先将矩阵 $A$ 左极式分解，得 $A = S J$

又 $J$ 可谱分解，所以 $J$ 可以相似对角化，设 $J = TDT^{-1}$

令 $U = ST,V = T^{-1}$ .显然 $U, V$ 都是酉矩阵。

所以 $A = U D V$ ，称之为 $A$ 的奇异值分解.
另外作者知乎ID同名，欢迎关注.
本文完