【学习笔记】数学小厦

OneInDark

已于 2022-07-20 17:02:35 修改

阅读量877

点赞数 2

分类专栏：数学文章标签：数学

于 2022-01-25 16:31:12 首次发布

本文链接：https://blog.csdn.net/qq_42101694/article/details/122543890

版权

数学专栏收录该内容

280 篇文章 1 订阅

订阅专栏

基础抽象代数

半群（ $\text{semi-group}$ ）

对于非空集合 $S$ 与二元运算 $+$ ，若 $+$ 具有封闭性、结合律，则 $\langle S,+\rangle$ 为半群。

群（ $\rm group$ ）

若半群 $\langle G,+\rangle$ 满足 $+$ 具有单位元、逆元，则 $\langle G,+\rangle$ 为群。简单群论入门。

阿贝尔群（ $\text{Abelian group}$ ）

若群 $\langle G,+\rangle$ 满足 $+$ 具有交换律，则 $\langle G,+\rangle$ 为阿贝尔群，又称交换群。

环（ $\rm ring$ 或 $\text{domain}$ ）

若阿贝尔群 $\langle R,+\rangle$ 满足 $\langle R,\times\rangle$ 为半群且 $\times$ 对 $+$ 有分配律，则 $\langle R,+,\times\rangle$ 为环。

理想（ $\text{ideal}$ ）：若 $I$ 是 $R$ 的加法子群，且 $I$ 满足 $\forall r\in R,\;rI\subseteq I$ ，则 $I$ 是 $R$ 的左理想。类似可定义右理想。二者兼具，则称为双边理想。

素理想：若 $R$ 的理想 $I$ 满足 $\forall ab\in I,\;a\in I\lor b\in I$ ，则 $I$ 是 $R$ 的素理想。可类比后文素元。

商环：设 $I$ 是 $R$ 的理想，则 $R$ 作为加法群有商群 $R / I$ ，定义其乘法 $a{+}I)(b{+}I)=ab{+}I$ ，不难验证其构成环。

不难发现 $R / I$ 是整环，当且仅当 $I$ 是 $R$ 的素理想。

幺环：存在乘法单位元（“幺元”）的环。

特征（ $\text{characteristic}$ ）：如果存在最小的正整数 $n$ 使得 $\forall a\in R,\;na=0$ ，则 $n$ 是环 $R$ 的特征。如果不存在这样的 $n$ ，认为 $R$ 的特征是 $0$ 。

对于幺环 $R$ ，其特征就是乘法幺元 $1$ 的加法阶（若无穷大则特征为零）。

整环（ $\text{integral domain}$ ）：无零因子的交换幺环。

定理：有限整环都是域。

证明：对 $\forall x\in R\setminus\{0\}$ ，考虑 $x R$ 即 $\{xa:a\in R\}$ 。注意到 $xa=xb\Rightarrow x(a{-}b)=0\Rightarrow a=b$ ，故 $|xR|=|R|\Rightarrow 1\in xR$ 即 $x$ 存在逆元。 $\blacksquare$

整环的整除理论

作为 $\text{OIer}$ ，唯一看重的非交换环就是矩阵。矩阵需要整除吗？

因此下面的讨论都针对整环 $R$ 。

基本定义

称 $\varepsilon\in R$ 是单位（ $\text{unit}$ ）当且仅当 $\varepsilon$ 存在逆元素。

称 $a, b$ 是相伴的（ $\text{associated}$ ）当且仅当存在单位 $\varepsilon$ 使得 $a=\varepsilon b$ 。

不难发现 $a, b$ 相伴等价于 $a\mid b\land b\mid a$ ，因此在整除意义下，相伴就是等价关系。单位与幺元等价，这是其被称为 “单位” 的原因。

$R$ 中不可逆非零元素 $p$ 被称为素元，当且仅当不存在 $a, b$ 使得 $p\mid ab$ 且 $p\nmid a$ 且 $p\nmid b$ 。

——插一句嘴：首先 $pR$ 是 $R$ 的理想，而 $pR$ 是素理想等价于 $p$ 是素元。

$R$ 中的不可逆非零元素 $p$ 被称为不可约（ $\text{irreducible}$ ）元素，当且仅当将其分解为两个元素的乘积 $p = ab$ 时，不可能 $a, b$ 都不是单位（即 $p$ 只有平凡因子）。

定理：整环中的素元都是不可约元素。

证明：设 $p = ab$ 为素元，不妨设 $p\mid a$ 即 $a = p c$ 。则有 $p=ab=(pc)b\Rightarrow p(1{-}cb)=0\Rightarrow cb=1$ 即 $b$ 是单位。 $\blacksquare$

最大公因子整环

对于不全为零的序列 $a_1,a_2,\dots,a_n\;(n>1)$ ，如果任意公因子 $c$ 都有 $c\mid d$ ，则称 $d$ 为最大公因子，记为 $d=\gcd\{a_1,a_2,\dots,a_n\}$ 。

整数环中的很多结论都可以直接迁移过来。

定理： $c\gcd(a,b)$ 与 $\gcd(ac,bc)$ 相伴。

证明：设 $d=\gcd(a,b),\;q=\gcd(ac,bc)$ ，则 $cd\mid ca\land cd\mid cb\Rightarrow cd\mid q$ 。设 $q = c d e$ ，联立 $q\mid ca$ 即 $ca=xq=cdex\Rightarrow(dex{-}a)c=0\Rightarrow a=dex$ 即 $de\mid a$ 。同理 $de\mid b$ ，因此 $de\mid d$ 即 $e$ 是单位，因此 $q$ 与 $c d$ 相伴。 $\blacksquare$

定理： $\gcd(a,b),\gcd(a,c)$ 都是单位时， $\gcd(a,bc)$ 是单位。

证明：用 $\approxeq$ 表示相伴，则 $\gcd(a,bc)\approxeq\gcd(\gcd(a,ac),bc)\approxeq\gcd(a,\gcd(ac,bc))\approxeq\gcd(a,c)$ 是单位，得证。 $\blacksquare$

若 $R$ 中任意两个非零元都存在最大公因子，则 $R$ 被称为最大公因子整环。

定理：最大公因子整环中，不可约元素都是素元。

证明：设不可约元素 $p\mid ab$ ，则 $\gcd(a,p)\approxeq\gcd(b,p)\approxeq 1$ 会说明 $\gcd(ab,p)\approxeq 1$ 矛盾。不妨设 $d=\gcd(a,p)\not\approxeq 1$ ，注意到 $d\mid p$ 而 $p$ 只有平凡因子，所以 $d\approxeq p$ ，即有 $p\mid a$ 。 $\blacksquare$

唯一分解整环（ $\text{UFD}$ ）

认为整环 $R$ 中元素 $n$ 拥有唯一分解，当且仅当 $n$ 可以被分解为 $n=\prod p_i$ ，且任何同种的分解 $n=\prod q_i$ 满足：二者长度相同，且可以将 ${q\}$ 重排使得 $p_i,q_i$ 相伴。

如果整环 $R$ 中任意元素 $n$ 满足，将其分解为若干素元（或不可约元）的乘积有唯一分解，则 $R$ 是唯一分解整环（ $\text{unique factorization domain}$ ）。

Remark. 在任意整环中，素元分解若存在即唯一，而不可约元素分解可能不唯一（但一定存在）。

定理：最大公因子整环都是唯一分解整环。

证明：在最大公因子整环上，不可约元素分解恰好构成素元分解。 $\blacksquare$

欧几里得环（ $\text{Euclidean Ring}$ ）

通俗解释：能够进行辗转相除的环。

严谨定义：若整环 $R$ 存在映射 $\phi:R\mapsto\N$ 使得 $a=mb+r\text{ s.t. }\phi(r)<\phi(b)$ 对任意 $a,b\in R,\;b\ne 0$ 都存在，则 $R$ 是欧几里得环。

可以看出 $\phi$ 是某种范数。但是不是这样有什么关系呢？我们只需要知道：

定理：欧几里得环都是最大公因子整环。

域（ $\rm field$ ）

若环 $\langle F,+,\times\rangle$ 满足 $\langle F\setminus\{0\},\times\rangle$ 为阿贝尔群（其中 $0$ 是 $+$ 的单位元）则 $\langle F,+,\times\rangle$ 为域。最常见的域是模质数 $p$ 的伽罗瓦域 $\Bbb{GF}(p)$ 。

线性空间

又称 向量空间 或矢量空间（ $\text{vector space}$ ），因为其维度为 $n$ 时，就与 $n$ 维空间的向量集合是同构的。下面是详细的定义；但事实上将其理解为向量就很足够了。

具体而言，设 $V$ 是一个非空集合， $P$ 是一个域，若满足下列条件：

加法封闭性： $\forall\alpha,\beta\in V,\;(\alpha+\beta)\in V$ 。
纯量乘法（数量乘法）封闭性： $\forall k\in P,\;\forall \alpha\in V,\;(k\cdot \alpha)\in V$ 。习惯上也可简写为 $k\alpha$ 。
$(V, +)$ 构成阿贝尔群（交换群）；其单位元为零向量 $\overrightarrow{0}$ 。
对于 $P$ 中乘法单位元 $\epsilon$ ，有 $\forall\alpha\in V,\;\epsilon\alpha=\alpha$ 。
乘法结合律： $\forall k,l\in P,\;\forall\alpha\in V,\;k(l\alpha)=(kl)\alpha$ 。
乘法分配律： $\forall k,l\in P,\;\forall\alpha\in V,\;(k+l)\alpha=(k\alpha)+(l\alpha)$ 。
乘法分配律： $\forall k\in P,\;\forall\alpha,\beta\in V,\;k(\alpha+\beta)=(k\alpha)+(k\beta)$ 。

则称 $V$ 为域 $P$ 上的一个线性空间。 $P$ 称为线性空间的基域。

子空间（ $\rm subspace$ ）

若 $W, V$ 是域 $P$ 上的线性空间，且 $W\subseteq V$ ，则 $W$ 是 $V$ 的子线性空间，简称子空间。

加法（和空间）

若 $A, B$ 是线性空间 $V$ 的子空间，定义二者的和 $A+B=\{\alpha+\beta\;|\;\alpha\in A,\;\beta\in B\}$ 。

容易发现 $(A + B)$ 仍然是线性空间 $V$ 的子空间。

直和（ $\text{direct sum}$ ）

当 $A\cap B=\{\overrightarrow{0}\}$ 时，二者的和被称为直和（偶尔被称为笛卡尔和），记作 $A\oplus B$ 。

可以发现 $\forall\gamma\in(A\oplus B)$ ，方程 $\gamma=\alpha+\beta\;(\alpha\in A,\;\beta\in B)$ 有唯一解。

张成空间（ $\rm span$ ）

$\alpha\in V$ ，显然 $\{k\alpha\;|\;k\in P\}$ 是子空间。记为 $span\{\alpha\}$ 。

递归地定义张成空间 $span\{\alpha_1,\alpha_2,\dots,\alpha_k\}=span\{\alpha_1,\alpha_2,\dots,\alpha_{k-1}\}+span\{\alpha_k\}\;(k\geqslant 2)$ ，这里的加法是和空间。

张成空间是 $V$ 的子空间。

线性无关

称 $\alpha_1,\alpha_2,\dots,\alpha_k$ 线性无关，当且仅当 $\forall i\in[1,k],\;\alpha_i\notin span(S\setminus\{\alpha_i\})$ ，其中 $S=\{\alpha_1,\alpha_2,\dots,\alpha_k\}$ 。

等价定义是，若存在非全零序列 $\lambda_1,\lambda_2,\dots,\lambda_k\in P,\;\sum\lambda_i\alpha_i=\overrightarrow{0}$ ，则它们是线性相关的；反之为线性无关。

维度（ $\dim$ ）

在线性空间 $V$ 中，存在线性无关向量组 $\alpha_1,\alpha_2,\dots,\alpha_k\in V\setminus\{\overrightarrow{0}\}$ ，最大的 $k$ 就是 $V$ 的维度，记为 $\dim V=k$ ，此时的向量组 $\langle\alpha\rangle$ 称为基底。基底可以有无穷多组。

等价定义： $V=span(\alpha_1,\alpha_2,\dots,\alpha_k)$ ，且 $\alpha_1,\alpha_2,\dots,\alpha_k$ 线性无关。然而这个等价性的证明，不用克莱姆法则我不会证；而这就涉及到行列式了……

显然 $\dim(A\oplus B)=\dim A+\dim B$ 。

$\color{red}{\text*}$ 除法（商空间）

这个好像不怎么有用……

定义 $\alpha+W=\{\alpha+\beta\;|\; \beta\in W\}\;(\alpha\in V)$ ，其中 $W$ 是 $V$ 的子空间。显然它得到的是一堆向量的集合。可是这集合并不是线性空间。类似陪集。

定义 $V/W=\{\alpha+W:\alpha\in V\}$ 。也就是 “向量集合” 的一个集族。它的含义就是，认为 $(\alpha-\beta)\in W$ 的 $\alpha,\beta$ 在一个 “等价类” 内，然后划分成若干等价类。类似陪集分解。

如果将子空间的加法推广到任意两个集合，那么我们会发现 $V / W$ 是一个线性空间。因为 $(\alpha+W)+(\beta+W)=\{\alpha+\beta+\phi+\psi:\phi,\psi\in W\}=(\alpha+\beta)+W$ ，标量乘法同理也可验证其符合定义。

然后我们有 $\dim(V/W)=\dim V-\dim W$ 。这很简单，因为 $V / W$ 的基底实际上是表示若干差值不属于 $W$ 的向量的。形式化地，若 $V / W$ 基底是 $\alpha_i+W\;(1\leqslant i\leqslant k)$ 而 $W$ 基底是 $\beta_i\;(1\leqslant i\leqslant m)$ ，那么一方面 $\langle\alpha_i\rangle,\langle\beta_i\rangle$ 是线性无关的（因为 $span\{\alpha_i\}$ 与 $W=span\{\beta_i\}$ 无交集），另一方面 $V=span\{\alpha_i,\beta_i\}$ ，因为每个向量都出现在了 $V / W$ 的某一个向量集合中，所以这就是 $V$ 的基底。

范数（ $\text{norm}$ ）

范数是一个 线性泛函，记为 $\Vert x\Vert$ ，满足

正定性： $\Vert x\Vert\geqslant 0$ ，当且仅当 $x=\overrightarrow{0}$ 时取等。
正值齐次性： $\forall x\in V,\;\alpha\in P$ ，满足 $\Vert\alpha x\Vert=|\alpha|\cdot \Vert x\Vert$ 。
三角不等式： $\Vert x+y\Vert\leqslant\Vert x\Vert+\Vert y\Vert$ 。

我们最熟悉的就是欧几里得范数，即向量的模长。

线性变换

线性映射（ $\text{linear map}$ 或 $\text{linear operator}$ ）

对于两个线性空间 $V, W$ ，若存在映射 $f:V\mapsto W$ 使得其加法运算、数量乘法都同态，则 $f$ 是 $V\mapsto W$ 的线性映射（或线性算子）。

Comment. 似乎各处的定义不尽相同？这里就以 $\text{Wikipedia}$ 为基准吧。

换句话说， $\forall\alpha,\beta\in V,\;f(\alpha+\beta)=f(\alpha)+f(\beta)$ 且 $\forall k\in P,\;f(k\alpha)=k\cdot f(\alpha)$ 。

线性泛函（ $\text{linear functional}$ ）

若线性算子 $f$ 是 $V\mapsto P$ 的映射，则 $f$ 是一个线性泛函。

线性变换（ $\text{linear transformation}$ ）

线性映射 $f:V\mapsto V$ 被称为线性变换。后面我们会说到，线性变换总可以表示为矩阵（在选定基底之后）。

线性变换对加法有 “分配律”，对乘法有 “交换律”，是近似于乘法的运算。所以为了方便，我们用 $\mathscr A$ 表示线性变换， $\mathscr A\alpha$ 表示 $f(\alpha)$ 。这是比较贴近算子概念的东西。

核（ $\rm kernel$ ）

$\ker(\mathscr A)=\{\alpha\;|\;\mathscr A\alpha=\overrightarrow{0}\}$ ，也就是那些映射到零向量上的向量。

可以发现 $\ker(\mathscr A)$ 是 $V$ 的子空间。另：更常写为 $\text{Ker}(\mathscr A)$ ，但是 $\LaTeX$ 的 \ker 就是小写的……

象（ $\rm image$ )

$\text{Im}(\mathscr A)=\{\mathscr A\alpha\;|\;\alpha\in V\}$ ，也就是映射的值域。

可以发现 $\text{Im}(\mathscr A)$ 是 $V$ 的子空间。另：我讨厌复数，它抢走了 \Im（虚部符号）。

降维打击

定理： $\dim V=\dim\ker(\mathscr A)+\dim\text{Im}(\mathscr A)$ 。

证明：取 $\ker(\mathscr A)$ 的基底 $\langle\alpha\rangle$ ；取 $\text{Im}(\mathscr A)$ 的基底 $\langle\theta\rangle$ ，则存在 $\langle\beta\rangle$ 使得 $\mathscr A\beta_i=\theta_i$ 。只需要证明 $V$ 的基底是 $\langle\alpha\rangle,\langle\beta\rangle$ 。

先证 $V=span\{\alpha_i,\beta_j\}$ 。任取 $\gamma\in V$ ，存在 $\nu\in span\{\beta_i\}$ 使得 $\mathscr A\gamma=\mathscr A\nu$ ，因为 $span\{\mathscr A\beta_i\}=span\{\theta_i\}=\text{Im}(\mathscr A)$ 。于是 $\mathscr A(\gamma-\nu)=\overrightarrow{0}$ ，即 $\gamma-\nu\in\ker(\mathscr A)=span\{\alpha_i\}$ 。所以有 $span\{\beta_i\}+span\{\alpha_i\}=V=span\{\alpha_i,\beta_j\}$ 。

再证其为直和，即 $\{\alpha_i,\beta_j\}$ 线性无关。这简单至极¹：若 $\sum\lambda_i\alpha_i+\sum\varphi_i\beta_i=\overrightarrow{0}$ ，两边同时做线性变换 $\mathscr A$ 得 $\sum\varphi_i\theta_i=\overrightarrow{0}$ 。由于 $\langle\theta\rangle$ 线性无关，所以必须 $\varphi_i=0$ ，代回原式得 $\sum\lambda_i\alpha_i=0$ ，由于 $\langle\alpha\rangle$ 线性无关，所以 $\lambda_i=0$ 。即全零为唯一解。所以线性无关。 $\blacksquare$

坐标与矩阵

随意找一组基底 $\langle\alpha_1,\alpha_2,\dots,\alpha_n\rangle$ ，则 $\forall\beta\in V$ 可用唯一分解 $\beta=\sum\lambda_i\alpha_i$ 的系数 $\langle\lambda\rangle$ 唯一确定。记为 $\beta=(\lambda_1,\lambda_2,\dots,\lambda_n)$ ，称为 $\beta$ 的坐标表示。

在坐标表示下，若 $\mathscr A\alpha=\beta$ ，那么二者的坐标表示必然是线性关系（否则 $\mathscr A$ 无法满足线性映射的性质）。于是可以找到系数矩阵 $x_{i,j}\;(1\leqslant i,j\leqslant n)$ 使得 $\lambda_{b:i}=\sum_{j=1}^{n}x_{i,j}\lambda_{a:j}$ ，这就是 $\mathscr A$ 的矩阵表达。

矩阵的秩 $\text{rank}$ 为矩阵中最多的线性无关列向量数量，也就是 $\dim\text{Im}(A)$ ，因为 $A\alpha$ 只能是这些列向量的线性和。

正交分解

线性变换的复合是 $\rm trivial$ 的，显然其构成半群。而自复合则构成阿贝尔群 ~~虽然这很蠢~~。因此关于 $\mathscr A$ 的多项式环 $P[\mathscr A]$ 构成交换环（乘法具有交换律）。

不变子空间

若 $W$ 是 $V$ 的子空间，满足 $\forall\alpha\in W,\;\mathscr A\alpha\in W$ ，则 $W$ 是 $V$ 在 $\mathscr A$ 上的不变子空间。

很明显 $\ker(\mathscr A)$ 就是一个不变子空间。~~尽管它可能小到只含零向量~~。

定理：任何关于 $\mathscr A$ 的多项式 $f(\mathscr A)$ 都满足 $\ker[f(\mathscr A)]$ 是 $\mathscr A$ 上的不变子空间。

证明： $\forall \alpha\in\ker[f(\mathscr A)],\;f(\mathscr A)\mathscr A\alpha=\mathscr Af(\mathscr A)\alpha=\overrightarrow{0}\implies\mathscr A\alpha\in\ker[f(\mathscr A)]$ 。 $\blacksquare$

矩阵分解

如果我们能找到若干不变子空间 $W_1,W_2,\dots,W_k$ 使得 $W_1\oplus W_2\oplus\cdots\oplus W_k=V$ ，那么 $V$ 有一组基底是所有 $W_i$ 的基底的并。在这个基底意义下，将 $\mathscr A$ 矩阵化，将得到近乎 准对角矩阵，因为一组基底进行 $\mathscr A$ 后的结果仍然可以用自己的线性和表示。

多项式分解

定理：若 $f(x)=f_1(x)f_2(x)$ 且 $gcd[f_1(x),f_2(x)]=1$ （多项式构成 欧几里得环），则 $\ker[f(\mathscr A)]=\ker[f_1(\mathscr A)]\oplus\ker[f_2(\mathscr A)]$ 。

证明： $\gcd=1\Leftrightarrow \exists t_1(x),t_2(x)$ 使得 $t_1(x)f_1(x)+t_2(x)f_2(x)=1$ 。

先证 $\ker[f(\mathscr A)]\subseteqq\ker[f_1(\mathscr A)]+\ker[f_2(\mathscr A)]$ 。任取 $\alpha\in\ker[f(\mathscr A)]$ ，令
$\begin{cases} \beta=t_2(\mathscr A)f_2(\mathscr A)\alpha\\ \gamma=t_1(\mathscr A)f_1(\mathscr A)\alpha \end{cases}$

可见
$\begin{aligned} f_1(\mathscr A)\beta &=t_2(\mathscr A)f_1(\mathscr A)f_2(\mathscr A)\alpha\\ &=t_2(\mathscr A)f(\mathscr A)\alpha\\ &=t_2(\mathscr A)\overrightarrow{0}=\overrightarrow{0} \end{aligned}$

即 $\beta\in\ker[f_1(\mathscr A)]$ 。同理 $\gamma\in\ker[f_2(\mathscr A)]$ 。而 $\alpha=\beta+\gamma$ ，得证。

再证 $\ker[f(\mathscr A)]\supseteqq\ker[f_1(\mathscr A)]+\ker[f_2(\mathscr A)]$ 。这是显而易见的。

最后证明二者无交集，为直和。若 $\alpha\in\ker[f_1(\mathscr A)]\cap\ker[f_2(\mathscr A)]$ ，则 $\alpha=[t_1(\mathscr A)f_1+t_2(\mathscr A)f_2(\mathscr A)]\alpha=\overrightarrow{0}$ 。 $\blacksquare$

零化多项式

使得 $f(\mathscr A)=0$ 的多项式，就是 $\mathscr A$ 的零化多项式。这里的 $0$ 是基域 $P$ 中的乘法零元。度数最小的首一零化多项式被称为最小多项式。

如果我们找到了 $\mathscr A$ 的首一零化多项式 $g(\mathscr A)$ ，不妨设 $g(x)=\prod (x-\gamma_i)^{t_i}$ ，利用 多项式分解 我们知道 $\ker[g(\mathscr A)]=\bigoplus\ker[(\mathscr A-\gamma_i)^{t_i}]$ 。而 $g(\mathscr A)=0$ ，这说明 $\ker[g(\mathscr A)]=V$ ，所以 $\ker[(\mathscr A-\gamma_i)^{t_i}]$ 是对原线性空间 $V$ 的一个剖分。

而 不变子空间 中说过 $\ker[(\mathscr A-\gamma_i)^{t_i}]$ 是 $\mathscr A$ 上的不变子空间，故在这些子空间中分别取基底，就可以将 $\mathscr A$ 的矩阵形式转化为 准对角矩阵。

特征多项式

若 $\mathscr Av=\lambda v\;(v\in V\setminus\{\overrightarrow 0\},\;\lambda\in P)$ 则称 $v$ 是 $\mathscr A$ 的特征向量， $\lambda$ 是 $\mathscr A$ 的特征值。

求解是容易的：实际上就是 $v\in\ker(\mathscr A-\lambda)$ 。在矩阵意义下， $0\ne\dim\ker(A-\lambda I)=\dim V-\text{rank}(A-\lambda I)$ ，所以只要 $A-\lambda I$ 不满秩即可。于是求解 $\lambda$ 就是解方程
$f(\lambda)=\det(\lambda I-A)=0$

其中 $\det(B)$ 表示矩阵 $B$ 的行列式。定义 $f(\lambda)$ 为 $A$ 的特征多项式。不难发现 $f (x)$ 是 $\deg=\dim V$ 的首一多项式。

有些有趣的性质。根据定义 $f(0)=\det(-A)$ ，而同时我们知道 $f(x)=\prod(x-\lambda_i)$ （因为每个根都是特征值），所以 $\prod \lambda_i=\det(-A)$ 。它的应用后面再说。

可能有重根；若 $\{\lambda_i\}$ 为互异的特征根，则 $f(x)=\prod(x-\lambda_i)^{\tau_i}$ ，其中 $\tau_i$ 为 $\lambda_i$ 的代数重数，而其对应的特征向量的张成子空间 $span\{v\;|\;Av=\lambda_i v\}$ 的 $\dim$ 为 $\lambda_i$ 的几何重数。

$\text{Cayley–Hamilton}$ 定理：特征多项式是零化多项式。²

引理：若几何重数均为 $1$ ，则最小多项式就是特征多项式。³

相似变换

如果存在可逆矩阵 $P$ 使得
$B=P^{-1}AP$
那么 $B$ 就和 $A$ 是相似的。这个变换叫做相似变换。

其相似的本质是： $B$ 和 $A$ 只是在不同的基底下考察相同的线性映射。

$\text{Jordan}$ 标准型

因为译名有明显分歧——有译为 “约当” 的，也有译为 “若尔当” 的——所以就保留英文 $\text{Jordan}$ 了。

定义 $\text{Jordan}$ 块是形如
$A_{i,j}=\begin{cases} \lambda& (j=i)\\ \lbrack j=i{+}1\rbrack & (j\ne i) \end{cases}$

的方阵 $A$ 。定义 $\text{Jordan}$ 标准型矩阵是 $\text{Jordan}$ 块构成的 准对角矩阵。

定理：在不考虑 $\text{Jordan}$ 块相对顺序时，每个矩阵都相似于唯一一个 $\text{Jordan}$ 标准型矩阵。

按：每个 $\text{Jordan}$ 块都是特征空间的一个基向量。因此 $\lambda$ 对应的 $\text{Jordan}$ 块的数量就是其几何重数。而大小显然是代数重数，因此我们得到

引理：每个特征值的几何重数不大于代数重数。

推论：矩阵可对角化，当且仅当其所有特征根的几何重数与代数重数相等。

Comment. 我并没有学会该知识点。从知乎文章中应该能学到更多东西。

迹（ $\text{trace}$ ）

矩阵 $A$ 的迹被定义为
$\operatorname{tr}A=\sum_{i=1}^{n}a_{i,i}$

即主对角线的元素和。很容易证明
$\operatorname{tr}(AB)=\operatorname{tr}(BA)$

因此我们可以证明相似矩阵的迹是相同的。
$\operatorname{tr}(P^{-1}AP)=\operatorname{tr}(PP^{-1}A)=\operatorname{tr}A$

通过 Jordan 标准型，我们立刻可以知道
$\operatorname{tr}A=\sum\lambda_i$

其中 $\lambda_i$ 是 $A$ 的特征值，即 $A$ 的特征多项式为 $\prod(x-\lambda_i)$ 。

对偶空间（ $\text{dual space}$ ）

在这里有一些对它的阐释。我并不很懂 $\text{dual space}$ ，因此先把参考文章贴出来。

线性空间 $V$ 的对偶空间，记为 $V^\ast$ ，是全体 $V$ 上的线性泛函。显然函数之间有加法与乘法，且构成矢量空间。

按：事实上，如果将 $V^\ast$ 内元素用 对偶基 坐标化，那么其作用效果相当于向量内积。

对偶基（ $\text{dual basis}$ ）

$V^*$ 存在一组基 $\{\phi_i\}$ 满足
$\phi_i(e_j)=[i=j]\epsilon$

其中 ${e_j\}$ 是 $V$ 的一组基， $\epsilon$ 是基域 $P$ 的幺元。这组基 $\{\phi_i\}$ 被称为对偶基。

典范同构（ $\text{canonical isomorphism}$ ）

注意到 $V^*$ 也是线性空间，因此 $V^*$ 也存在对偶空间，记为 $V^{**}$ ，它被称为 $V$ 的 $\text{bidual}$ 。

首先 $\dim(V)=\dim(V^\ast)=\dim(V^{\ast\ast})$ 。而且 $V$ 和 $V^{\ast\ast}$ 之间存在典范同构：设 $u\in V$ 与 $\hat u\in V^{\ast\ast}$ 是同态元素，定义
$\hat u(\phi)=\phi(u)\quad(\forall\phi\in V^\ast)$

不难验证 $\hat u$ 是 $V^\ast$ 上的线性泛函，且 $u$ 与 $\hat u$ 同态。

对偶映射（ $\text{dual map}$ ）

任取线性映射 $f:V\mapsto W$ ，则对于任意 $W$ 上的线性泛函 $h$ ，可以发现复合函数 $h\circ f$ 是 $V$ 上的线性泛函。并且它关于 $h$ 肯定是 $\text{linear}$ 的。因此这给出了 $f^\ast:W^\ast\mapsto V^\ast$ 对偶空间之间的线性映射。这被称为 $f$ 的对偶或转置（ $\text{transpose}$ ）。因为

定理： $f^\ast$ 在 $\text{dual basis}$ 上的矩阵就是 $f$ 的矩阵的转置。

证明：坐标化后， $f$ 的矩阵的每一列就是 $f(e_i)$ ，其中 ${e_i\}$ 是 $V$ 的基。

考虑 $W$ 上的线性泛函 $h=\langle x_1,x_2,\cdots,x_n\rangle$ ，尝试写出 $h\circ f$ 的坐标。显然 $e_i$ 将会提供 $h(f(e_i))$ ，也就是 $\eta_i=\sum_{j}x_j A_{j,i}$ ，其中 $A$ 是 $f$ 对应的矩阵，第 $i$ 列恰为 $f(e_i)$ 坐标。

不难发现这就是 $A^{\sf T}h$ ，因此 $A^\mathsf{T}$ 就是 $f^\ast$ 对应的矩阵。 $\blacksquare$

伴随矩阵

对于 $n\times n$ 方阵 $A$ ，将第 $i$ 行、第 $j$ 列元素移除后，剩余的行和列按原顺序排列，得到 $(n{\rm-}1)$ 阶方阵，其行列式记为 $M_{i,j}$ ，称为余子式。

定义 $C_{i,j}=(-1)^{i+j}M_{i,j}$ 为代数余子式，定义 $A$ 的伴随矩阵 $A^{*}$ 为 $A^*_{i,j}=C_{j,i}$ 。此时有
$[A\times A^*]_{i,j}=\sum_{k}A_{i,k}A^*_{k,j}=\sum_{k}A_{i,k}C_{j,k}$

当 $i = j$ 时，该式为 $\det(A)$ 的按行展开。当 $i\ne j$ 时，该值等价于将第 $j$ 行元素替换为第 $i$ 行元素后按行展开的 $\det$ ，即 $0$ 。于是我们得到
$A\times A^*=\det(A)\cdot I$

其中 $I$ 是单位对角矩阵。

性质推导

记 $\text{rank}(A)$ 为 $A$ 的秩，则
$\operatorname{rank}(A^*)= \begin{cases} n, &\operatorname{rank}(A)=n\\ 1, &\operatorname{rank}(A)=n-1\\ 0, &\operatorname{rank}(A)<n-1 \end{cases}$

对于第一项：对 $A\times A^*=\det(A)\cdot I$ 两边同时取行列式得 $\det(A)\cdot \det(A^*)=\det(A)^n\Rightarrow\det(A^*)=\det(A)^{n-1}\ne 0$ 即 $\operatorname{rank}(A^*)=n$ 。

对于第三项：此时删去一行一列后，仍不满秩，故 $M_{i,j}=0$ ，即 $A^*$ 为全零矩阵。

对于第二项：此时 $A\times A^*=\det(A)\cdot I$ 为全零阵，所以 $A^*$ 的列向量 $v$ 满足 $Av=\overrightarrow{0}$ 。而 $\operatorname{rank}(A)=n-1$ ，所以 $A v = 0$ 的解 $v$ 至多有一个自由元，即解空间的 $\dim=1$ 。所以 $A^*$ 的列向量组的秩为 $1$ ，即 $\operatorname{rank}(A^*)=1$ 。

代码求解

在域上

当 $\operatorname{rank}(A)=n$ 时，由于 $A^{-1}$ 可以 $\mathcal O(n^3)$ 求解，故 $A^*=|A|\cdot A^{-1}$ 也可以快速求解。平凡情况 $\operatorname{rank}(A)<n-1$ 略。只需要讨论 $\operatorname{rank}(A)=n-1$ 的情况。

事实上，性质推导 中已经说过解法：解 $A v = 0$ 可得非零向量特解 $v_0$ ，则 $A^*$ 的列向量都是 $v$ 的若干倍。同理可解行向量 $q$ 使得 $q A = 0$ ，则 $q$ 也是 $A^*$ 任意一行的若干倍。

存在 $i, j$ 使得 $v_iq_j\ne 0$ 。暴力求出 $C_{i,j}$ ，那么 $A^*$ 列向量 “除以” $v$ 的商的比值就是 $q_1,q_2,\dots,q_n$ ，故 $A_{x,y}=\frac{q_y}{q_j}\cdot\frac{v_x}{v_i}\cdot A_{i,j}$ ，可以全部求出。总复杂度 $\mathcal O(n^3)$ 。

在欧几里得环上

也就是说，我们主要的工具就只是高斯消元。考虑完全意义上的解决原问题：删去一行一列后求行列式。

首先枚举一行，将其删去，求出剩余矩阵高斯消元后的结果，不难发现其应只在 $j\geqslant i-1$ 处 $a_{i,j}\ne 0$ 。我们姑且不考虑此步的复杂度。

再枚举删去哪一列，则左上方为对角矩阵、右下角为上海森堡矩阵。只需求解任意右下角 $i\times i$ 上海森堡矩阵的行列式。将 $\det$ 按第一行展开得
$f_i = \sum_{j=i}^{n} (-1)^{j-i} f_{j+1} a_{i,j}\prod_{k=i}^{j-1} a_{k,k}$

于是压力来到删去一行上。事实上只需分治，将确定要保留的部分立刻消元完毕。

消去一个变元的时间复杂度是 $\mathcal O[n\cdot(n+\log|R|)]$ ，其中 $∣ R ∣$ 是环的大小。共 $\mathcal O(n\log n)$ 次消元，总复杂度 $\mathcal O(n^3\log n + n^2\log n\log|R|)$ 。

在模合数的环上

前面的做法基于高斯消元。消元的本质是左乘初等行变换矩阵。所以我们实际上求出了
$A'\times A^\ast = \det(A)\cdot C$

其中 $C$ 是若干初等行变换矩阵的乘积， $A^{'}$ 是高斯消元的结果。对两边同时提取 $(i, j)$ 位置的系数，根据 $A^{'}$ 为上三角矩阵的特性可知
$\sum_{k\geqslant i} A'_{i,k} A^\ast_{k,j} = \det(A)\cdot C_{i,j}$

只要 $A'_{i,i}$ 的逆元存在，且 $A^*$ 更靠后的行上的值已知，就可以得到 $A^*_{i,j}$ 了。因此只用讨论这些行。

不妨将所有这样的元素放在最后 $k$ 行 $k$ 列的主对角线上（对应修改 $C$ 矩阵即可）。则左上角的 $(n{-}k)\times(n{-}k)$ 方阵是对角矩阵，而最后 $k$ 列无法消元。

利用 $\textit{CRT}$ ，只需求出模数为 $p^{\tau}$ 的答案。

定理：若 $k>\tau$ 则所有余子式为 $p^k$ 的倍数。

证明：把模数当成 $p$ 之后 $\text{rank}\leqslant n-\tau$ ，删去一行之后仍有至少 $(\tau{-}1)$ 个主对角线元素为 $0$ （是 $p$ 的倍数）因此取模 $p^k$ 意义下所有余子式是零。 $\blacksquare$

因此 $k\leqslant\tau\leqslant\log P$ 时才需要计算；这 $k$ 行套用 在欧几里得环上 的做法，时间复杂度 $\mathcal O(n^3+n^2\log P\log\log P)$ 。

递推数列

常系数线性递推数列

其基础算法内容写在另一文中。

求向量或矩阵的最短递推式

设运算在 $\mathbb{GF}(p)$ 下进行。先考虑求解向量列的最短递推式。

随机生成 $n$ 维向量 $v$ ，则可以将每个向量先与 $v$ 求内积，再求解内积的最短递推式。

不难发现，此时求出的线性递推式 $A (x)$ 是使得 $[A(x)f(x)-R(x)]\cdot v=0$ 的解，其中多项式的系数为向量。根据 $\text{Schwartz–Zippel}$ 引理⁴，随机向量 $v$ 与非零向量相乘，得到零的概率不超过 $\frac{n}{p}$ 。在 $n\ll p$ 时可以放心选用。

对 $n{\times}m$ 矩阵列，可随机 $n$ 维行向量和 $m$ 维列向量，然后作向量乘法。同理，若矩阵非全零，第一次乘法得到零向量概率不超过 $\frac{n}{p}$ ，在非零向量情况下第二次乘法得到零概率不超过 $\frac{m}{p}$ ，所以正确率至少 $\frac{(p-n)(p-m)}{p^2}\geqslant\frac{n+m}{p}$ 。

求矩阵最小多项式

最短线性递推式就是最小多项式。且长度不超过 $n$ ，因为特征多项式是解。

于是我们只需要得到 $\{ab,aMb,aM^2b,\dots,aM^{2n}b\}$ ，其中 $a, b$ 是随机向量， $M$ 是原矩阵。对它作 $\textit{BM}$ 是 $\mathcal O(n^2)$ 的，并非瓶颈。

全体 $aM^i$ 可以 $\mathcal O(n^3)$ 求出（总是用向量乘矩阵），然后乘 $b$ ，总复杂度 $\mathcal O(n^3)$ 。特别地，若 $M$ 只有 $\alpha$ 个非零值，则 $v M$ 的计算复杂度是 $\mathcal O(n{+}\alpha)$ ，因此总复杂度为 $\mathcal O(n^2{+}\alpha n)$ 。这将使得下面的算法对于稀疏矩阵有较好的结果。

解满秩线性方程组

先求出最小多项式 $f (x)$ ，由 $f (A) = 0$ 乘 $A^{-1}$ 后移项得 $A^{-1}=-\frac{1}{[x^0]f(x)}\sum_{i=1}^{\deg(f(x))}A^{i-1}[x^i]f(x)$ 。解满秩线性方程组就是求 $A^{-1}b$ ，由上述等式，可以 $\mathcal O(n^2{+}\alpha n)$ 的求出答案。

求稀疏矩阵行列式

由 引理 知，几何重数均为 $1$ 时，最小多项式是特征多项式。特征多项式的常数项就是 $\det(-A)$ ，由此可知 $\det(A)$ 。而最小多项式可以 $\mathcal O(n^2{+}\alpha n)$ 。

遗憾的是 $A$ 未必满足上述性质。于是随机 $n{\times}n$ 对角矩阵 $B$ ，可以证明 $A\times B$ 至少有 $(1-\frac{2n^2-n}{p})$ 的概率满足该性质³。求出 $\det(A\times B)$ 后除以 $\det(B)$ 即可。时间复杂度 $\mathcal O(n^2{+}\alpha n)$ 。

整式递推数列

基本定义

若存在有限非空多项式列 $\{P_0(x),P_1(x),P_2(x),\dots,P_{m-1}(x)\}$ 满足 $P_{m-1}(x)\ne 0$ 且 $\sum_{i=0}^{m-1}P_i(x)A^{(i)}(x)=0$ ，则称形式幂级数 $A (x)$ 为微分有限（ $\text{D-finite}$ ）的，其中 $A^{(i)}(x)$ 表示 $A (x)$ 的 $i$ 阶导函数。

若存在有限非空多项式列 $\{P_0(x),P_1(x),P_2(x),\dots,P_{m-1}(x)\}$ 满足 $P_0(x)\ne 0$ 且 $\sum_{i=0}^{m-1}a_{n-i}P_i(n)=0\;(n\geqslant m{-}1)$ 则称 ${P_i(x)\}$ 为 ${a_i\}$ 的整式递推式，此时 ${a_i\}$ 是一个整式递推数列。

也就是说，递推的系数是关于当前项的下标 $n$ 的有理式（对于分式只需令 $P_0(x)$ 为分母）。但 $\deg P_i(x)=+\infty$ 时，不很令人满意……

定理： ${a_i\}$ 是整式递推数列，当且仅当其普通生成函数 $A (x)$ 是微分有限的。

求复合后的系数

主要参考 $\textsf{EI}$ 的干货讲义与配套的实验性讲稿。 $\textsf{Prean}$ 又重讲了一遍。

~~我也试试启发性讲法~~。这个想法的启发源自线性求 $\rm Bell$ 数：

欲求 $[x^n]\exp(\exp(x)-1)=[x^n]\sum_{i=0}^{+\infty}\frac{(\exp(x)-1)^i}{i!}$ ，由 $x^0]\exp(x)-1=0$ 知 $i > n$ 时无贡献。由此答案即为
$\begin{aligned} [x^n]\sum_{i=0}^{n}\frac{(\exp(x){-}1)^i}{i!} &=[x^n]\sum_{i=0}^n\sum_{j=0}^i(-1)^{i-j}\exp(xj)\frac{1}{j!(i{-}j)!}\\ &=[x^n]\sum_{j=0}^{n}\frac{\exp(xj)}{j!}\sum_{i=0}^{n-j}\frac{(-1)^i}{i!}\\ &=\sum_{j=0}^{n}\frac{j^n}{j!}\sum_{i=0}^{n-j}\frac{(-1)^i}{i!} \end{aligned}$

后者是前缀和，可预处理。前者利用线性筛求出。时间复杂度 $\mathcal O(n)$ 。

关键点：其一是内层函数常数项为零；其二是外层函数可展开为幂级数。

那么，更一般地，我们考虑求解 $\sum_{i=0}^{n}a_i[x^i]F(G(x))$ ，其中 $F (x)$ 是微分有限的，不妨设 $\sum_{j=0}^{m-1}P_j(x)F^{(j)}(x)=0$ 。引入系数 $a_i$ 只是为了 ~~用来卖萌~~ 显得更通用。下面是 $\sf EI$ 的讲法。

第一步，让 $G (x)$ 常数为零（多项式平移）。直接写出微分有限的条件
$\sum_{i=0}^{m-1}P_i(x{+}c)F^{(i)}(x{+}c)=0$

因为答案就是关于 $F(y{+}c)\Big|_{y=G(x)-c}$ 的，并且只需 $y^n$ 以内的项。

第二步，截断。令 $\mathscr F(x{+}c)=F(x{+}c)\bmod x^{n+1}$ ，考虑对方程的影响。设 $\gamma=\max\deg(P_i)$ ，显然会存在多项式 $\mathscr D(x)$ ，其只在 $x^{n-m+2}$ 到 $x^{n+\gamma}$ 项有值，且
$\begin{aligned} \sum_{i=0}^{m-1}P_i(x{+}c)\mathscr{F}^{(i)}(x{+}c)&=\mathscr{D}(x)\\ \Rightarrow\sum_{i=0}^{m-1}P_i(x)\mathscr{F}^{(i)}(x)&=\mathscr{D}(x{-}c) \end{aligned}$

两边对比系数可以 $\mathcal O(m\gamma n)$ 求出 $[x^i]\mathscr{F}(x)\;(i\leqslant n)$ 。对于需自行推导的多项式，一般 $m,\gamma$ 都是常数级别。

第三步，求答案。由于截断过程实际上只消去了 $G(x){-}c)$ 的 $n{+}1)$ 及更高次项，所以答案不受影响，即
$\begin{aligned} \sum_{i=0}^{n}a_i[x^i]F(G(x)) =\sum_{i=0}^{n}a_i[x^i]\mathscr{F}(G(x))\\ =\sum_{i=0}^{n}a_i[x^i]\sum_{j=0}^{n}G(x)^j[x^j]\mathscr{F}(x)\\ =\sum_{j=0}^{n}[x^j]\mathscr{F}(x)\sum_{i=0}^{n}a_i[x^i]G(x)^j \end{aligned}$

所以我们只需快速求出 $G(x)^j\;(j\leqslant n)$ 中某些系数的线性和。当 ${a_i\}$ 非零值少，或 $G (x)$ 形式简单时，这是很可能实现的。例题较零碎，写于他处。

补充一句： $\mathscr A\overrightarrow{0}=\overrightarrow{0}$ ，因为 $\mathscr A$ 需要对加法有 “分配律”，那么单位元必须仍然是单位元。 ↩︎
定理证明参见维基百科，~~因为我看不懂~~。或参见 $\sf EI$ 的博客，当然其更难懂。 ↩︎
在 $2019$ 年论文《两类递推数列的性质和应用》被提及；我无法给出证明。 ↩︎ ↩︎
引理内容参见维基百科。 ↩︎