FVM in CFD 学习笔记_第10章_求解代数方程组系统

最新推荐文章于 2023-09-06 08:20:20 发布

梅冠华

最新推荐文章于 2023-09-06 08:20:20 发布

阅读量1.8k

点赞数 6

分类专栏： FVM in CFD 学习笔记

本文链接：https://blog.csdn.net/meiguanhua/article/details/104894689

版权

FVM in CFD 学习笔记专栏收录该内容

14 篇文章 137 订阅

订阅专栏

学习自F. Moukalled, L. Mangani, M. Darwish所著The Finite Volume Method in Computational Fluid Dynamics - An Advanced Introduction with OpenFOAM and Matlab
Chapter 10 Solving the System of Algebraic Equations

离散过程将会生成线性方程组系统， $\bold A \boldsymbol \phi = \bold b$ ，其中未知量 $\boldsymbol \phi$ 位于网格单元形心上，是待求量。该系统中，未知变量的系数构成了矩阵 $\bold A$ ，其由线性化过程和网格几何量导出，而向量 $\bold b$ 则包含了源项、常数项、边界条件和非线性分量。

求解线性方程组系统的技术通常被分为直接方法和迭代方法，每类又有很多具体方法。由于流动问题是高度非线性的，从其线性化过程得到的系数通常是依赖于解的，因此，在每步的迭代过程中并不需要得到非常精确的解，所以直接解法在CFD的应用中很少使用。最常用的还是迭代解法，因为它们更适合求解该类问题，其在每步迭代中所需内存更小，计算消耗更小。

本章首先讲解在结构和非结构网格上的一些直接解法（Gauss消元、LU分解、三对角和五对角矩阵算法），以便为在CFD应用中更加广泛使用的迭代方法提供基础。然后回顾一些基本的迭代解法（含预处理和不含预处理）的特性和局限性，包括Jacobi、Gauss-Seidel、不完全LU分解、以及共轭梯度（CG）方法。最后，简要讲讲多重网格方法，它通常是和迭代方法联合使用，以克服这些迭代方法的局限性。

1 引言

线性求解器求解的是如下形式的代数方程组
$\bold A \boldsymbol \phi = \bold b$
其中 $\bold A$ 是单元的系数矩阵 $a_{ij}$ ， $\boldsymbol \phi$ 是未知变量 $\phi$ 的向量，而 $\bold b$ 则是源项 $b_i$ 的矢量。使用矩阵编号，该方程的展开形式为
$\begin{bmatrix} a_{11} & a_{12} & ... & a_{1~N-1} & a_{1~N} \\ a_{21} & a_{22} & ... & a_{2~N-1} & a_{2~N} \\ ... & ... & ... & ... & ... \\ a_{N1} & a_{N2} & ... & a_{N~N-1} & a_{N~N} \end{bmatrix} \begin{bmatrix} \phi_1 \\ \phi_2 \\ ... \\ \phi_{N-1} \\ \phi_N \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ ... \\ b_{N-1} \\ b_N \end{bmatrix}$
一般来说呢，矩阵 $\bold A$ 中的每一行代表计算域1个单元上定义的方程，非0系数是与该单元紧邻的邻居单元的，系数 $a_{ij}$ 反映的是存储在 $i$ 单元控制体形心的 $\phi_i$ 与其邻近单元形心的 $\phi_j$ 的关系紧密程度。由于一个单元只和少数几个单元相邻，且其邻接关系是与离散区域上单元的剖分编码方式相关的，所以大部分的系数实际上是0，这就使得矩阵 $\bold A$ 总是个稀疏矩阵（即，非零元素的个数很少，在整体矩阵中占比很小，绝大多数的元素都是0）。更进一步，如果用的是结构化的网格，那么矩阵 $\bold A$ 将会是带状矩阵，即，其仅含几条非零的对角线元素。因此，求解该类系统时，可针对其特性选用对应的高效方法。

如上所述，求解代数方程组系统的方法可以大体上分为两大类，即直接和迭代方法。在直接方法中，矩阵 $\bold A$ 求逆，解 $\bold\phi$ 通过 $\bold\phi=\bold A^{-1}\bold b$ 来求出。当矩阵 $\bold A$ 非常大的时候，应用直接线性解法来求解CFD问题是不切实际的，因为这些CFD问题通常包含非线性系统方程，即它们的系数是与解相关联的，那么使用迭代方法是切合实际的。

另一方面，在迭代代数解法中，求解算法将重复多次直至达到预期的收敛水平，而不需要在每次迭代的过程中都获得完全收敛的解。

接下来，首先展示一些应用于结构和非结构网格的直接解法，紧接着是结构网格上带状矩阵的高效解法，该章的重点是，迭代线性代数求解器，它们已经被广为证明是在FVM中最有效的和最经济的方法，而且已经被包含进几乎所有有限体积代码的线性求解器中。

2 直接或Gauss消元方法

尽管直接方法并非求解线性代数方程组中稀疏系统的高效方法（它们的计算消耗实在是大的离谱），然而对于它们的讨论可为后续高效的迭代方法的引入铺平道路，所以还是讲一下为好。最简单的直接方法是Gauss消元方法，将被首先介绍。使用Gauss消元法时，将系统转化成等效的上三角系统，这激发了下三角上三角分解方法（LU分解方法），将随后介绍。该方法中，矩阵 $\bold A$ 将被分解成两个矩阵 $\bold L$ 和 $\bold U$ 的乘积，其中 $\bold L$ 是下三角矩阵，而 $\bold U$ 是上三角矩阵。该过程也被称为LU因子分解。此外，还将讨论应用于从结构网格所推出的带状矩阵 $\bold A$ 的直接方法。

2.1 Gauss消元

假设有如下2变量 $\phi_1$ 和 $\phi_2$ 的线性方程组
$a_{11}\phi_1+a_{12}\phi_2=b_1 \\ ~\\ a_{21}\phi_1+a_{22}\phi_2=b_2$
为了消去 $\phi_1$ ，将第1个式子乘上 $a_{21}/a_{11}$ ，并减去第2个式子，可得
$\left(a_{22}-\frac{a_{21}}{a_{11}}a_{12}\right)\phi_2=b_2-\frac{a_{21}}{a_{11}}b_1$
从而可以直接求得 $\phi_2$
$\phi_2=\frac {b_2-\displaystyle\frac{a_{21}}{a_{11}}b_1} {a_{22}-\displaystyle\frac{a_{21}}{a_{11}}a_{12}}$
再把这个求得的 $\phi_2$ 代入到方程最初的第1个式子里，可以求得 $\phi_1$ 的值
$\phi_1=\frac{b_1}{a_{11}}-\frac{a_{12}}{a_{11}}\frac {b_2-\displaystyle\frac{a_{21}}{a_{11}}b_1} {a_{22}-\displaystyle\frac{a_{21}}{a_{11}}a_{12}}$
上述过程实际上分成了2步，第1步是消去1个未知量，得到仅剩1个未知量的方程，求解该方程，可得该未知量的值；第2步是将该未知量回代到原方程中，求出剩余未知量的值。即，消元-回代，同样的思路也可用于N个变量的线性代数方程组。

2.2&2.3 前向消元Forward Elimination

直接给出算法流程

for k = 1 to N - 1
{
	for i = k + 1 to N	
	{
		Ratio = a_ik / a_ kk
		for j = k + 1 to N
		{
			a_ij = a_ij - Ratio * a_kj
		}
		b_i = b_i - Ratio * b_k
	}
}

2.4&2.5 反向回代Backward Substitution

直接给出算法流程

phi_N = b_N / a_NN
for i = N - 1 to 1
{
	Term = 0
	for j = i + 1 to N
	{
		Term = Term + a_ij * phi_j
	}
	phi_i = (b_i - Term) / a_ii
}

为防止被0除，消元的时候可选用最大行主元，并互换两行的位置。实际上，Gauss消元回代的方法计算量是非常大的，对于一个N个方程的线性系统，其计算量与 $N^3/3$ 成正比，其中回代过程仅仅占了 $N^2/2$ ，这样高的计算消耗迫使人们针对稀疏矩阵系统寻求更加高效的解法。

2.6 LU分解

求解线性代数方程组的另一个直接解法是LU或PLU（P即前面所讲的行主元选择过程），咱这里就讲讲LU就好了。LU实际上是Gauss方法的变种，LU方法比Gauss消元方法的优势在于，一旦LU分解执行之后，对于右端项 $\bold b$ 不同的线性系统就想求解多少次就求解多少次，而不需要再做消元处理了（相当于把第1次的消元处理做了LU分解），然而在Gauss消元方法中，消元是始终需要进行的。

基于前面消元处理过程，是将原本的矩阵 $\bold A$ 转化为上三角矩阵，即
$\begin{bmatrix} u_{11} & u_{12} & u_{13} & ... & u_{1~N-1} & u_{1~N} \\ 0 & u_{22} & u_{23} &... & u_{2~N-1} & u_{2~N} \\ 0 & 0 & u_{33} & ... & u_{3~N-1} & u_{3~N} \\ ... & ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 0 & u_{N~N} \end{bmatrix} \begin{bmatrix} \phi_1 \\ \phi_2 \\ \phi_3 \\ ... \\ \phi_N \end{bmatrix} = \begin{bmatrix} c_1 \\ c_2 \\ c_3 \\ ... \\ c_N \end{bmatrix}$
使用缩写形式，即
$\bold U \boldsymbol \phi - \bold c = \bold 0$
令 $\bold L$ 为单位下三角矩阵（对角线上的元素是1），即
$\bold L = \begin{bmatrix} 1 & 0 & 0 & ... & 0 & 0 \\ l_{21} & 1 & 0 & ... & 0 & 0 \\ l_{31} & l_{32} & 1 & ... & 0 & 0 \\ ... & ... & ... & ... & ... & ... \\ l_{N1} & l_{N2} & l_{N3} & ... & l_{N~N-1} & 1 \end{bmatrix}$
将方程 $\bold U \boldsymbol \phi - \bold c = \bold 0$ 左乘以 $\bold L$ ，则变回了最初的方程
$\bold L(\bold U \boldsymbol \phi - \bold c) = \bold L \bold U \boldsymbol \phi - \bold L \bold c=\bold A \boldsymbol \phi - \bold b$
这样，变得到
$\bold L \bold U = \bold A$
和
$\bold L \bold c = \bold b$
即，矩阵 $\bold A$ 写成了下三角和上三角矩阵的乘积形式，即 $L U$ 分解。

2.7 分解步骤

将 $\bold L \bold U = \bold A$ 写成展开形式
$\begin{bmatrix} 1 & 0 & 0 & ... & 0 & 0 \\ l_{21} & 1 & 0 & ... & 0 & 0 \\ l_{31} & l_{32} & 1 & ... & 0 & 0 \\ ... & ... & ... & ... & ... & ... \\ l_{N1} & l_{N2} & l_{N3} & ... & l_{N~N-1} & 1 \end{bmatrix} \begin{bmatrix} u_{11} & u_{12} & u_{13} & ... & u_{1~N-1} & u_{1~N} \\ 0 & u_{22} & u_{23} &... & u_{2~N-1} & u_{2~N} \\ 0 & 0 & u_{33} & ... & u_{3~N-1} & u_{3~N} \\ ... & ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 0 & u_{N~N} \end{bmatrix} = \begin{bmatrix} a_{11} & a_{12} & a_{13} & ... & a_{1~N-1} & a_{1~N} \\ a_{21} & a_{22} & a_{23} &... & a_{2~N-1} & a_{2~N} \\ a_{31} & a_{32} & a_{33} &... & a_{3~N-1} & a_{3~N} \\ ... & ... & ... & ... & ... & ... \\ a_{N1} & a_{N2} & a_{N3} & ... & a_{N~N-1} & a_{N~N} \end{bmatrix}$
$\bold L$ 的第1行和 $\bold U$ 的每一列（第1到N列）相乘，得到
$u_{1j}=a_{1j}~~~~j=1,2,3,...,N$
接下来，让 $\bold L$ 的第2到第N行与 $\bold U$ 的第1列相乘，得到
$l_{i1}u_{11}=a_{i1}\Rightarrow l_{i1}=\frac{a_{i1}}{u_{11}}~~~~i=2,3,...,N$
重复该过程，让 $\bold L$ 的第2行与 $\bold U$ 的第2到第N列相乘，得到
$l_{21}u_{1j}+u_{2j}=a_{2j} \Rightarrow u_{2j}=a_{2j} - l_{21}u_{1j}~~~~j=2,3,...,N$
然后呢，再把 $\bold L$ 的第3到N行与 $\bold U$ 的第2列相乘，得到
$l_{i1}u_{12}+l_{i2}u_{22}=a{i2} \Rightarrow l_{i2}=\frac{a{i2}-l_{i1}u_{12}}{u_{22}}~~~~i=3,4,...,N$
如此不断重复，直至解出所有 $\bold L$ 和 $\bold U$ 的元素值。

一般来说， $\bold L$ 的第i行与 $\bold U$ 的第i到第N列相乘，可得
$u_{ij}=a_{ij}-\sum_{k=1}^{i-1}l_{ik}u_{kj}~~~~j=i,i+1,...,N$
而 $\bold L$ 的第i+1到第N行与 $\bold U$ 的第i列相乘，则可得
$l_{ki}=\frac{a_{ki}-\sum_{j=1}^{i-1}l_{kj}u_{ji}}{u_{ii}}~~~~k=i+1,i+2,...,N$
对于 $\bold L$ 的第N行，其系数与 $\bold U$ 的第N列相乘后，得到
$u_{NN}=a_{NN}-\sum_{k=1}^{N-1}l_{Nk}u_{kN}$
LU分解的算法汇总如下

2.8 LU分解算法

for j = 1 to N
	u_1j = a_1j
for i = 2 to N
	l_i1 = a_i1 / u_11
for i = 2 to N-1
{
	for j = i to N
	{
		sum = 0
		for k = 1 to i-1
			sum += l_ik * u_kj
		u_ij = a_ij - sum
	}
	for k = i+1 to N
	{
		sum = 0
		for j = 1 to i-1
			sum += l_kj * u_ji
		l_ki = (a_ki - sum) / u_ii
	}
}
sum = 0
for i = 1 to N-1
	sum += l_Ni * u_iN
u_NN = a_NN - sum

2.9 回代步

把原矩阵 $\bold A$ 分解为 $\bold L$ 和 $\bold U$ 之后，方程系统可分两步来求解（ $\bold U \boldsymbol \phi = \bold c,~\bold L \bold c = \bold b$ ），两步方法等效于求解两个线性系统方程，然而却由于 $\bold L$ 和 $\bold U$ 的上下三角形式而极大简化了求解过程。

第1步是求解 $\bold L \bold c = \bold b$ ，通过前向回代，可以直接得出
$\begin{aligned} & c_1 = b_1 \\ & c_i = b_i - \sum_{j=1}^{i-1}l_{ij}c_j,\quad\quad i=2,3,...,N \end{aligned}$

第2步是求解 $\bold U \boldsymbol \phi = \bold c$ ，采用反向回代，可以直接得到
$\begin{aligned} & \phi_N = \frac{C_N}{u_{NN}} \\ & \phi_i = \frac{c_i - \displaystyle \sum_{j=i+1}^{N}u_{ij}\phi_j}{u_{ii}},\quad\quad i=N-1,N-2,...,3,2,1 \end{aligned}$

实际上， $\bold L$ 和 $\bold U$ 的元素可以直接存放在最初的矩阵 $\bold A$ 中，如果 $\bold A$ 不再需要的话（当LU分解完成后， $\bold A$ 的确是没啥用了，求解的时候只用 $\bold L$ 和 $\bold U$ 就行了）。对于 $N\times N$ 维矩阵执行LU分解需要的计算量是 $2N^3/3$ ，是用Gauss消元法求解线性代数方程组的两倍！然而，LU分解的优势就在于，只用做一次分解，就可以把同样的矩阵 $\bold A$ 应用于不同的右端项 $\bold b$ 来求解各种问题。然而，这里LU分解引入的另一个目的，是在于用它来引出其它更加高效的迭代解法。

2.10 LU分解和Gauss消元

也许并不明显，但是在Guass消元的过程中，悄然完成了LU分解。前向消元过程生成了上三角矩阵 $\bold U$ ，在此过程中，下三角矩阵 $\bold L$ 也悄悄算好了，因为 $\bold L$ 的元素实际上就是在消元过程中各行乘上的那个因子。下面的算法，将在Gauss消元的基础上，同时完成LU分解。那么用这个算法显然更方便些哈。

2.11 由Gauss消元来做LU分解的算法

如果把 $\bold L$ 和 $\bold U$ 放在原来的矩阵 $\bold A$ 中，那么直接这么做就好了，相当于在Gauss消元的算法中，把系数存放到了下三角位置上，注意，不需要对 $\bold b$ 做处理，因为LU分解就是为了求解不同的右端项 $\bold b$ 的

for k = 1 to N-1
{
	for i = k+1 to N
	{
		a_ik = a_ik / a_kk
		for j = k+1 to N
			a_ij = a_ij - a_ik * a_kj
	}
}

如果 $\bold L$ 和 $\bold U$ 另外找地方放，还要保留矩阵 $\bold A$ 的话，那么直接把矩阵 $\bold A$ 复制一份出来，还用上面的算法就行了。

例1 用LU分解方法求解如下线性代数方程组
$\begin{bmatrix} 3 & -1 & 0 & 0 \\ -2 & 6 & -1 & 0 \\ 0 & -2 & 6 & -1 \\ 0 & 0 & -2 & 7 \\ \end{bmatrix} \begin{bmatrix} \phi_1 \\ \phi_2 \\ \phi_3 \\ \phi_4 \end{bmatrix} =\begin{bmatrix} 3 \\ 4 \\ 5 \\ -3 \end{bmatrix}$

解
求解过程从略，答案直接给出
$\bold L=\begin{bmatrix} 1 & 0 & 0 & 0 \\ -\displaystyle\frac{2}{3} & 1 & 0 & 0 \\ 0 & -\displaystyle\frac{3}{8} & 1 & 0 \\ 0 & 0 & -\displaystyle\frac{16}{45} & 1 \\ \end{bmatrix}, \quad\quad \bold U =\begin{bmatrix} 3 & -1 & 0 & 0 \\ 0 & \displaystyle\frac{16}{3} & -1 & 0 \\ 0 & 0 & \displaystyle\frac{45}{8} & -1 \\ 0 & 0 & 0 & \displaystyle\frac{299}{45} \\ \end{bmatrix}$
$\bold c=\begin{bmatrix} 3 \\ 6 \\ 29/4\\ -19/45 \end{bmatrix},\quad\quad \boldsymbol \phi=\begin{bmatrix} 435/299 \\ 408/299 \\ 382/299 \\ -19/299 \end{bmatrix}$

2.12 带状稀疏矩阵的直接解法

Gauss消元和LU分解适用于任何方程组系统，当然，它们可以用于求解从结构或非结构网格的守恒方程离散得出的控制方程组。当使用结构网格时，离散过程得到的系统方程的非零元素仅存在于少数几个对角线上，依据不同的离散框架，常出现三对角或五对角矩阵，对于它们的求解可以提出更加高效的方法。实际上相当于把Gauss消元法应用于这类特定的问题中而已。

2.13 三对角矩阵算法（TDMA）

在这里插入图片描述

一维问题导出的方程往往具有三对角形式，即
$a_i \phi_i + b_i \phi_{i+1}+c_i \phi_{i-1} = d_i, \quad\quad i=1,2,3,...,N, \quad\quad c_1=b_N=0$
对于 $i = 1$ ，可直接推得 $\phi_1$ 和 $\phi_2$ 的关系
$\Rightarrow a_1\phi_1=-b_1\phi_2 + d_1 \Rightarrow \phi_1=-\frac{b_1}{a_1}\phi_2+\frac{d_1}{a_2}$
同样对于 $i = 2$ ，可导出 $\phi_2$ 和 $\phi_3$ 的关系
$\Rightarrow a_2\phi_2 = -b_2\phi_3 - c_2\phi_1 + d_2 \Rightarrow \phi_2=-\frac{a_1b_2}{a_1a_2-c_2b_1}\phi_3 + \frac{d_2a_1-c_2d_1}{a_1a_2-c_2b_1}$
同样的操作可用于 $\phi_3$ 到 $\phi_N$ ，假设 $\phi_i$ 可用 $\phi_{i+1}$ 表示为
$\phi_i = P_i \phi_{i+1} + Q_i,\quad\quad i=1,2,3,...,N$
假设对 $i - 1$ 上式已知，那么对 $i$ 的推导如下
$\left. \begin{matrix} \phi_{i-1}=P_{i-1}\phi_i + Q_{i-1} \\ a_i \phi_i + b_i \phi_{i+1}+c_i \phi_{i-1} = d_i \end{matrix} \right\} \Rightarrow \phi_i=-\frac{b_i}{a_i+c_iP_{i-1}}\phi_{i+1}+\frac{d_i-c_iQ_{i-1}}{a_i+c_iP_{i-1}}$
从而推得 $P_i$ 和 $Q_i$ 为
$P_i=-\frac{b_i}{a_i+c_iP_{i-1}} \quad\quad Q_i=\frac{d_i-c_iQ_{i-1}}{a_i+c_iP_{i-1}} \quad\quad i=2,3,4,...,N$
对于 $i = 1$ ，可直接算得 $P_1$ 和 $Q_1$
$P_1=-\frac{b_1}{a_1}\quad\quad Q_1=\frac{d_1}{a_2}$
而对于 $i = N$ ，由于 $b_N=0$ ，有
$b_N=0\Rightarrow P_N=0 \Rightarrow \phi_N=Q_N$
TDMA算法总结如下

计算 $P_1$ 和 $Q_1$ ，用
$P_1=-\frac{b_1}{a_1}\quad\quad Q_1=\frac{d_1}{a_2}$
计算 $P_i$ 和 $Q_i$ ， $i = 2, 3, . . ., N$ ，用
$P_i=-\frac{b_i}{a_i+c_iP_{i-1}} \quad\quad Q_i=\frac{d_i-c_iQ_{i-1}}{a_i+c_iP_{i-1}}$
求出 $\phi_N$ ，用
$\phi_N=Q_N$
反向依次求出 $\phi_i$ ， $i = N - 1, N - 2, . . ., 3, 2, 1$ ，用
$\phi_i = P_i \phi_{i+1} + Q_i,\quad\quad i=N-1,N-2,...,3,2,1$

2.14 五对角矩阵算法（PDMA）

还是1维问题，只不过离散格式用的精度更高，让i节点与i+1，i+2，i-1，i-2都有关系，这样子出来的离散矩阵便是5对角形式了，即
$a_i\phi_i+b_i\phi_{i+2}+c_i\phi_{i+1}+d_i\phi_{i-1}+e_i\phi_{i-2}=f_i\quad\quad i=1,2,3,...,N$
对于边界的几个节点，有
$d_1=e_1=e_2=0 \\ b_{N-1}=b_{N}=c_{N}=0$
对于 $i = 1$ ，有
$\phi_1=-\frac{b_1}{a_1}\phi_3-\frac{c_1}{a_1}\phi_2+\frac{f_1}{a_1}$
对于 $i = 2$ ，有
$\phi_2=-\frac{a_1b_2}{a_1a_2-d_2c_1}\phi_4-\frac{a_1c_2-b_1d_2}{a_1a_2-d_2c_1}\phi_3+\frac{a_1f_2-d_2f_1}{a_1a_2-d_2c_1}$
该过程可重复下去，获取第 $i$ 个变量 $\phi_i$ 的通有形式
$\phi_i=P_i\phi_{i+2}+Q_i\phi_{i+1}+R_i\quad\quad i=1,2,3,...,N$
在 $\phi_{i-1}$ 和 $\phi_{i-2}$ 已知的情况下，可求得 $\phi_i$ 的形式为
$\begin{aligned} \phi_i=&-\frac{b_i}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}}\phi_{i+2} \\ &-\frac{c_i+(d_i+e_iQ_{i-2})P_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}}\phi_{i+1} \\ &-\frac{f_i-e_iR_{i-2}-(d_i+e_iQ_{i-2})R_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}} \end{aligned}$
比较可得
$P_i=-\frac{b_i}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}} \\ Q_i= -\frac{c_i+(d_i+e_iQ_{i-2})P_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}} \\ R_i= -\frac{f_i-e_iR_{i-2}-(d_i+e_iQ_{i-2})R_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}}$
前两个节点，即 $i = 1, 2$ 的值为
$\begin{aligned} & P_1 = -\frac{b_1}{a_1},\quad Q_1=-\frac{c_1}{a_1},\quad R_1=\frac{f_1}{a_1} \\ & P_2 = -\frac{b_2}{a_2+d_2Q_1}, \quad Q_2 = -\frac{c_2+d_2P_1}{a_2+d_2Q_1}, \quad R_2 = \frac{f_2-d_2R_1}{a_2+d_2Q_1} \end{aligned}$
由于 $b_{N-1}=b_{N}=c_{N}=0$ ，所以 $P_{N-1}=P_N=Q_N=0$ ，那么 $\phi_N$ 和 $\phi_{N-1}$ 的方程为
$\begin{aligned} & \phi_N=R_N \\ & \phi_{N-1}=Q_{N-1}\phi_N+R_{N-1} \end{aligned}$
将PDMA算法的流程汇总如下

计算 $P_1,~Q_1,~R_1,~P_2,~Q_2,~R_2$ ，使用
$\begin{aligned} & P_1 = -\frac{b_1}{a_1},\quad Q_1=-\frac{c_1}{a_1},\quad R_1=\frac{f_1}{a_1} \\ & P_2 = -\frac{b_2}{a_2+d_2Q_1}, \quad Q_2 = -\frac{c_2+d_2P_1}{a_2+d_2Q_1}, \quad R_2 = \frac{f_2-d_2R_1}{a_2+d_2Q_1} \end{aligned}$
对于 $i = 3, 4, 5, . . ., N$ 计算 $P_i, ~Q_i,~ R_i$ ，用
$P_i=-\frac{b_i}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}} \\ Q_i= -\frac{c_i+(d_i+e_iQ_{i-2})P_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}} \\ R_i= -\frac{f_i-e_iR_{i-2}-(d_i+e_iQ_{i-2})R_{i-1}}{a_i+e_iP_{i-2}+(d_i+e_iQ_{i-2})Q_{i-1}}$
计算 $\phi_N$ 和 $\phi_{N-1}$ ，用
$\begin{aligned} & \phi_N=R_N \\ & \phi_{N-1}=Q_{N-1}\phi_N+R_{N-1} \end{aligned}$
对于 $i = N - 2, N - 3, . . ., 3, 2, 1$ ，计算 $\phi_i$ ，用
$\phi_i=P_i\phi_{i+2}+Q_i\phi_{i+1}+R_i$

3 迭代方法

直接解法通常并不适用于求系数疏矩阵为稀疏情况下大型的方程组，即，大多数矩阵元素是0的情况。这种情况经常会出现，比如线性化的系统方程反映的是非线性的问题（系数是依赖于解的），或是处理与时间相关的系统时。这些也正是求解流动问题时经常碰到的方程类型。

相对而言，迭代方法对于这些问题更具吸引性，因为线性化系统的解变成了迭代求解过程的一部分。而且迭代方法占用内存小、计算消耗低，这都是它比直接解法有优势的地方。

迭代方法有许多系列，对它们的详细回顾可参考相关文献书籍。本章主要介绍下基本的迭代方法，并介绍多重网格算法，其可有效克服迭代方法中的缺陷。Gauss消元和LU分解直接方法的讲解只是为了阐明数值过程中的一些基本概念，以便更加深入地理解迭代方法。

为了统一这些方法的表达形式，系数矩阵将统一写成如下形式
$\bold A = \bold D + \bold L + \bold U$
其中 $\bold D$ 、 $\bold L$ 、 $\bold U$ 分别是对角、严格下三角、严格上三角矩阵。即，相当于把原来系数矩阵 $\bold A$ 的元素剥离成对角矩阵、下三角矩阵和上三角矩阵（注意，这里的 $\bold L$ 和 $\bold U$ 并非是前面的LU分解出来的矩阵，而只是把原始矩阵 $\bold A$ 的对角线元素、下三角元素、上三角元素拿出来构成的矩阵而已）。

迭代方法在求解线性系统 $\bold A \boldsymbol \phi = \bold b$ 时，计算一系列的解 $\boldsymbol \phi^{(n)}$ ，这些解当满足特定的条件时，收敛到精确解 $\boldsymbol \phi$ 。这样，对于特定解法而言，需要选择一个初值 $\boldsymbol \phi^{(0)}$ （选择为初始条件或初始猜测值），还需要构造一个从 $\boldsymbol \phi^{(n-1)}$ 计算到 $\boldsymbol \phi^{(n)}$ 的迭代过程。

定点迭代可通过将矩阵 $\bold A$ 分解为
$\bold A = \bold M - \bold N$
这样，原方程 $\bold A \boldsymbol \phi = \bold b$ 转化为
$(\bold M - \bold N)\boldsymbol \phi = \bold b$
使用定点迭代过程，上式变为
$\bold M \boldsymbol \phi^{(n)} = \bold N \boldsymbol \phi^{(n-1)} + \bold b$
可改写成如下形式
$\boldsymbol \phi^{(n)} = \bold B \boldsymbol \phi^{(n-1)} + \bold C\bold b \quad\quad n=1,2,...$
其中 $\bold B=\bold M^{-1} \bold N$ ，而 $\bold C=\bold M^{-1}$ 。这些矩阵的选择不同将产生不同的迭代方法。

在详细描述各种迭代方法之前，先讲下迭代方法需要满足什么样的一些特性，才能让其得到收敛的解。

A. 在收敛的时候，有 $\boldsymbol \phi^{(n)} =\boldsymbol \phi^{(n-1)}=\boldsymbol \phi$ ，则迭代方程可以写成
$\boldsymbol \phi = \bold B \boldsymbol \phi + \bold C\bold b$
即
$\bold C^{-1}(\bold I - \bold B) \boldsymbol \phi = \bold b$
与原方程 $\bold A \boldsymbol \phi = \bold b$ 相比较，可得
$\bold A=\bold C^{-1}(\bold I - \bold B)$
或
$\bold B + \bold C \bold A = \bold I$
不同矩阵间的关系保证了当达到精确解的时候，再继续迭代不会更改所得值。

B. 从 $\boldsymbol \phi^{0} \neq \boldsymbol \phi$ 开始，该方法应保证 $\boldsymbol \phi^{n}$ 随着迭代次数 $n$ 的增加最终收敛到 $\boldsymbol \phi$ 。因为 $\boldsymbol \phi^{n}$ 可以展开成 $\boldsymbol \phi^{0}$ 的如下形式
$\boldsymbol \phi^{n} = \bold B^n \boldsymbol \phi^{0} + \sum_{i=0}^{n-1}\bold B^i \bold C \bold b$
那么，若要收敛成立，则需要让 $\bold B$ 满足（即让 $\boldsymbol \phi^{0}$ 的影响完全消失掉）
$\lim_{n\rightarrow\infin}\bold B^n=\lim_{n\rightarrow\infin} \underbrace{\bold B *\bold B *\bold B*... *\bold B}_{n~times}=\bold 0$
这意味着 $\bold B$ 的谱半径要小于1，即
$\rho(\bold B) < 1$
该条件保证了迭代方法是有自我纠正能力的，即，其对于精确解的任何不利的错误扰动是robust（健壮的，鲁棒的）的。

关于该条件的深层理解，可以通过定义精确值与迭代值之间的错误矢量 $\bold e^{(n)}$ ，即
$\bold e^{(n)}=\boldsymbol \phi^{(n)}-\boldsymbol \phi \\ \bold e^{(n-1)}=\boldsymbol \phi^{(n-1)}-\boldsymbol \phi$
将 $\boldsymbol \phi = \bold B \boldsymbol \phi + \bold C\bold b$ 与 $\boldsymbol \phi^{(n)} = \bold B \boldsymbol \phi^{(n-1)} + \bold C\bold b$ 两式子互减，可得
$\bold e^{(n)} = \bold B \bold e^{(n-1)}$
因此，若方法是收敛的，则应满足如下式子
$\lim_{n\rightarrow\infin}\bold e^{(n)}=0$
为使上式更有意义，假设 $\bold B$ 的特征向量是完全的，且形成一个完备集，即它们是 $\bold R^N$ 的基本集。那么 $\bold e$ 可以用 $\bold B$ 的 $N$ 个特征向量 $\bold v$ 的线性组合表示，即
$\bold e=\sum_{i=1}^{N}\alpha_i \bold v_i$
每个特征向量满足
$\bold B \bold v_i = \lambda_i \bold v_i$
其中 $\lambda_i$ 是与特征向量 $\bold v_i$ 相关的特征值，根据 $\bold e^{(n)} = \bold B \bold e^{(n-1)}$ ，从第1个迭代步开始，有
$\bold e^{(1)} = \bold B \bold e^{(0)} = \bold B \sum_{i=1}^{N}\alpha_i \bold v_i = \sum_{i=1}^{N}\alpha_i (\bold B\bold v_i) = \sum_{i=1}^{N}\alpha_i (\lambda_i \bold v_i)$
对于第2次迭代，误差变为
$\bold e^{(2)} = \bold B \bold e^{(1)} = \bold B \sum_{i=1}^{N}\alpha_i (\lambda_i \bold v_i) = \sum_{i=1}^{N}\alpha_i \lambda_i (\bold B \bold v_i) = \sum_{i=1}^{N}\alpha_i \lambda_i^2 \bold v_i$
该过程可重复执行，有
$\bold e^{(n)} = \sum_{i=1}^{N}\alpha_i \lambda_i^n \bold v_i$
因此，如果随着 $n$ 趋近无穷大迭代过程要趋于收敛的话，那么所有的特征值必须小于1。如果特征值之中有任何大于1的，那么误差将趋于无穷大。这就很好地解释了为啥谱半径要小于1，因为谱半径实际上是最大特征值，即
$\rho(\bold B) = \max_{i=1}^{N}(\lambda_i) < 1$
通过减小迭代矩阵的谱半径，也可以提高迭代方法的收敛速度，这也是迭代技术的核心。

C. 迭代方法中需要给出停止判据，应用较多的准则是给予残差的幅值变化，残差如下
$\bold r^{(n)} = \bold A \boldsymbol \phi^{(n)} - \bold b$
一个准则是找寻区域中的最大残差，让其值小于某个阈值 $\epsilon$ 定义为收敛条件，即
$\max_{i=1}^N \left| b_i - \sum_{j=1}^N a_{ij} \phi_j^{(n)} \right| \le \epsilon$
或者root mean square残差（RMS均方根残差）小于 $\epsilon$ ，即
$\frac{\displaystyle \sum_{i=1}^{N}\left( b_i - \sum_{j=1}^N a_{ij}\phi_j^{(n)} \right)^2}{N} \le \epsilon$
还有一种准则是让两个连续迭代过程中的最大单位化差值小于 $\epsilon$ ，即
$\max_{i=1}^{N}\left| \frac{\phi_i^{(n)}-\phi_i^{(n-1)}}{\phi_i^{(n)}} \right| \times 100 \le \epsilon$
顺道说一句，我本人（梅冠华）最喜欢和最常用的判据，是计算两次迭代的差值向量的2范数（幅值），再用本次迭代结果向量的2范数（幅值）去单位化处理，然后让该值小于某个 $\epsilon \approx 10^{-6}$ ，个人感觉，这种方法兼顾了向量的各个分量，又抛掉了正负号的影响，还做了单位化处理，是比较合理的，即
$\frac{\sqrt{\sum_{i=1}^{N}\left(\phi_i^{(n)}-\phi_i^{(n-1)}\right)^2}}{ \sqrt{\sum_{i=1}^{N}\left(\phi_i^{(n)}\right)^2} + eps } \le \epsilon$
其中的 $e p s$ 是一个非常小的数，比如 $1 e - 12$ ，主要是为了防止分母是0，出现被0除的情况，比如你的初始速度场全是0值的情况。

3.1 Jacobi方法

这恐怕是求解线性方程组系统中最简单的迭代方法了，Jacobi方法的图示如下
在这里插入图片描述
对于原方程 $\bold A \boldsymbol \phi = \bold b$ ，其迭代步骤为
$\phi_i^{(n)}=\frac{1}{a_{ii}}\left( b_i - \sum_{j=1,~j\ne i}^{N} a_{ij} \phi_j^{(n-1)} \right)\quad\quad i=1,2,3,...,N$
即，迭代中获得的新值并不用于本次迭代后续值的计算，而是在下次迭代时再去使用。使用矩阵，将上式的展开形式写出来，即
$\begin{bmatrix} a_{11} & 0 & ... & 0 & 0 \\ 0 & a_{22} & ... & 0 & 0 \\ ... & ... & ... & ... & ... \\ 0 & 0 & ... & a_{N-1, ~N-1} & 0 \\ 0 & 0 & ... & 0 & a_{NN} \end{bmatrix} \begin{bmatrix} \phi_1 \\ \phi_2 \\ ... \\ \phi_{N-1} \\ \phi_N \end{bmatrix} + \begin{bmatrix} 0 & a_{12} & ... & a_{1,~N-1} & a_{1, N} \\ a_{21} & 0 & ... & a_{2,~N-1} & a_{2, N} \\ ... & ... & ... & ... & ... \\ a_{N-1,~1} & a_{N-1,~2} & ... & 0 & a_{N-1,~N} \\ a_{N,1} & a_{N,2} & ... & a_{N,~N-1} & 0 \end{bmatrix} \begin{bmatrix} \phi_1 \\ \phi_2 \\ ... \\ \phi_{N-1} \\ \phi_N \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ ... \\ b_{N-1} \\ b_N \end{bmatrix}$
求解 $\boldsymbol \phi^{(n)}$ ，上式转化为
$\begin{bmatrix} \phi_1^{(n)} \\ \phi_2^{(n)} \\ ... \\ \phi_{N-1}^{(n)} \\ \phi_N^{(n)} \end{bmatrix}=\begin{bmatrix} a_{11} & 0 & ... & 0 & 0 \\ 0 & a_{22} & ... & 0 & 0 \\ ... & ... & ... & ... & ... \\ 0 & 0 & ... & a_{N-1, ~N-1} & 0 \\ 0 & 0 & ... & 0 & a_{NN} \end{bmatrix}^{-1} \left( \begin{bmatrix} b_1 \\ b_2 \\ ... \\ b_{N-1} \\ b_N \end{bmatrix} - \begin{bmatrix} 0 & a_{12} & ... & a_{1,~N-1} & a_{1, N} \\ a_{21} & 0 & ... & a_{2,~N-1} & a_{2, N} \\ ... & ... & ... & ... & ... \\ a_{N-1,~1} & a_{N-1,~2} & ... & 0 & a_{N-1,~N} \\ a_{N,1} & a_{N,2} & ... & a_{N,~N-1} & 0 \end{bmatrix} \begin{bmatrix} \phi_1^{(n-1)} \\ \phi_2^{(n-1)} \\ ... \\ \phi_{N-1}^{(n-1)} \\ \phi_N^{(n-1)} \end{bmatrix} \right)$
使用 $\bold A = \bold D + \bold L + \bold U$ ，可将上式转化为
$\boldsymbol \phi^{(n)}=-\bold D^{-1}(\bold L + \bold U)\boldsymbol \phi^{(n-1)} + \bold D^{-1}\bold b$
那么只要 $\rho(-\bold D^{-1}(\bold L + \bold U))<1$ 则Jacobi方法是收敛的。该条件对于很多类型的矩阵都是满足的，其中一种就是对角占优矩阵，即它们的系数满足
$\sum_{j=1,~j\ne i}^{N} |a_{ij}| \le |a_{ii}| \quad\quad i=1,2,3,...,N$

3.2 Gauss-Seidel方法

从Jacobi方法改进而来的更好的方法是Gauss-Seidel方法，其收敛特性更好，而且占用内存较少，因为其不需要再单独存储计算出来的新值了，因为它用的都是最新算出来的值。Gauss-Seidel方法的示意图为
在这里插入图片描述
Guass-Seidel方法的迭代关系式为
$\phi_i^{(n)}=\frac{1}{a_{ii}}\left( b_i - \sum_{j=1}^{i-1} a_{ij} \phi_j^{(n)} - \sum_{j=i+1}^{N} a_{ij} \phi_j^{(n-1)} \right)\quad\quad i=1,2,3,...,N$
如果要写成矩阵形式，即
$\boldsymbol \phi^{(n)}=-(\bold D + \bold L)^{-1}\bold U\boldsymbol \phi^{(n-1)} + (\bold D + \bold L)^{-1}\bold b$
Gauss-Seidel方法更为高效，因为其计算 $\phi_j^{(n)}$ 的时候用的是最新算出的 $\phi_i^{(n)},~i=1,2,3,...,j-1$ 。该方法很节省内存，因为直接用新值覆盖旧值即可。Gauss-Seidel迭代收敛的要求是
$\rho(-(\bold D + \bold L)^{-1}\bold U)<1$
尽管在某些情况下Jacobi方法收敛更快，然而Gauss-Seidel仍然是首选方法。

例2

对于例1给出的系统方程，采用Jacobi和Gauss-Seidel方法，迭代5次，并计算每次迭代解与真实解的误差，迭代初值选为
$\boldsymbol \phi^*=[0~0~0~0]^T$
解
较为简单，略去不提，感兴趣的可自行计算。

3.3 预处理和迭代方法

迭代方法 $\boldsymbol \phi^{(n)} = \bold B \boldsymbol \phi^{(n-1)} + \bold C\bold b \quad\quad n=1,2,...$ 的收敛速度依赖于迭代矩阵 $\bold B$ 的谱半径，这与矩阵的系数相关。尽管迭代方法是把原系统方程转化为有相同解的等效系统，但是拥有更好的谱半径特性。在这些条件下，等效系统的特征值更加聚集，使得其比原系统的迭代收敛速度更快。预处理器就是这样定义的一种矩阵，即
$\bold P^{-1}\bold A\boldsymbol \phi = \bold P^{-1}\bold b$
其有着和原方程 $\bold A \boldsymbol \phi = \bold b$ 同样的解，但是 $\bold P^{-1}\bold A$ 的谱半径特性更好。定义预处理器 $\bold P$ 的时候，其难点在于找寻一个与 $\bold A^{-1}$ 近似的矩阵，而且还要很容易做求逆运算（为了计算 $\bold P^{-1}$ ）。

将之前的式子 $\bold A = \bold M - \bold N$ 中的 $\bold M$ 替换成 $\bold P$ ，则 $\bold M = \bold P$ 且 $\bold A = \bold P - \bold N$ ，那么与之相关的迭代系统变为
$\begin{aligned} \boldsymbol \phi^{(n)} & = \bold B \boldsymbol \phi^{(n-1)} + \bold C \bold b \\ & = \bold P^{-1} \bold N \phi^{(n-1)} + \bold P^{-1} \bold b \\ & = \bold P^{-1}(\bold P - \bold A) \phi^{(n-1)} + \bold P^{-1} \bold b \\ & = (\bold I - \bold P^{-1} \bold A)\phi^{(n-1)} + \bold P^{-1} \bold b \end{aligned}$
写成残差形式，为
$\begin{aligned} \boldsymbol \phi^{(n)} & = (\bold I - \bold P^{-1} \bold A)\phi^{(n-1)} + \bold P^{-1} \bold b \\ & = \phi^{(n-1)} + \bold P^{-1} ( \bold b - \bold A)\phi^{(n-1)} \\ & = \phi^{(n-1)} + \bold P^{-1} \bold r^{(n-1)} \end{aligned}$
从这两个方程中我们可以看出，迭代方法只不过是做了分解 $\bold A = \bold P - \bold N$ 的预处理系统的定点迭代方法，其中的谱半径特性为
$\rho(\bold I - \bold P^{-1} \bold A) < 1$
作为比较，对于Jacobi和Gauss-Seidel的预处理矩阵J和JS分别为
$\bold P_J = \bold D \\ \bold P_{GS}=\bold D + \bold L$
其中 $\bold D$ 和 $\bold L$ 分别是矩阵 $\bold A$ 的对角和下三角部分。

这样，预处理是对原系统的一种提高谱半径特性的处理方式，其运用预处理矩阵 $\bold P$ 来提高迭代效率。下面我们将会看到，可以提出更加优越的预处理矩阵，其系数的定义更加复杂。

3.4 矩阵分解技术

Gauss-Seidel和Jacobi方法的低收敛速度，激发人们寻求更加快速的迭代方法。一种加速迭代收敛速度的方法是通过使用更好的预处理器来开发迭代方法，一个简单和行之有效的方法是对原矩阵 $\bold A$ 执行不完全分解，之所以是不完全分解，因为完全分解的话，把矩阵 $\bold A$ 分解成下三角矩阵 $\bold L$ 和上三角矩阵 $\bold U$ 的工作量跟直接求解方程是相当的，而且计算耗费很大，内存消耗很大（丧失了稀疏特性）。

3.5 不完全LU分解（ILU）

如同在例1中看到的那样， $\bold L$ 和 $\bold U$ 矩阵会出现原矩阵 $\bold A$ 中 $0$ 元素地方的非 $0$ 元素（这是所谓的fill-in填补）。所以呢，如果是要做不完全LU（ILU）分解的话，那么得到的下三角 $\bold L$ 和上三角 $\bold U$ 矩阵应该和原矩阵 $\bold A$ 中下三角和上三角的非零元素排布完全一致才好，即
$\bold A = \bold L \bold U +\bold R$
其中 $\bold R$ 是分解过程产生的残差，矩阵 $\bold L$ 和 $\bold U$ 是稀疏矩阵（与矩阵 $\bold A$ 的排布一样），这样处理起来非常方便，相比而言，如果是做完全分解的话，处理起来就麻烦多了。然而， $\bold L \bold U$ 只是矩阵 $\bold A$ 的近似，就需要采用迭代求解过程来求解方程组系统了。求解过程得第1步是把方程组 $\bold A \boldsymbol \phi = \bold b$ 重写成
$\bold A \boldsymbol \phi=\bold b \Rightarrow \bold 0 = \bold b - \bold A \boldsymbol \phi \Rightarrow (\bold A -\bold R)\boldsymbol \phi = (\bold A -\bold R)\boldsymbol \phi + (\bold b - \bold A \boldsymbol \phi)$
迭代形式可以写成
$(\bold A -\bold R)\boldsymbol \phi^{(n)} = (\bold A -\bold R)\boldsymbol \phi ^{(n-1)} + (\bold b - \bold A \boldsymbol \phi ^{(n-1)})$
上式常写成修正形式，即定义
$\boldsymbol \phi^{(n)} = \boldsymbol \phi^{(n-1)} + \boldsymbol \phi'^{(n)}$
这样迭代过程变为
$(\bold A -\bold R) \boldsymbol \phi'^{(n)} = (\bold b - \bold A \boldsymbol \phi ^{(n-1)})$
即每步迭代中，用上式算得 $\boldsymbol \phi'^{(n)}$ ，然后用 $\boldsymbol \phi^{(n)} = \boldsymbol \phi^{(n-1)} + \boldsymbol \phi'^{(n)}$ 算得 $\boldsymbol \phi^{(n)}$ 。

ILU分解可以通过Gauss消元法，并去掉一些在预设位置的非对角元素来实现，那么舍弃元素所处的位置不同便催生了不同的ILU近似。

3.6 不完全LU分解不含填补（ILU(0)）

有许多ILU分解技术的变种，然而最简单的莫过于ILU(0)了，在ILU(0)中，0元素在矩阵 $\bold L$ 和 $\bold U$ 中的位置是和原矩阵 $\bold A$ 中的0元素位置严格对应的。使用Gauss消元，计算过程和完全LU分解是一样的，只是如果在原矩阵 $\bold A$ 的0元素位置处出现了新的非0元素（ $l_{ij}$ 和 $u_{ij}$ ），那么直接把它们刨掉就是了。因此，矩阵 $\bold L$ 和 $\bold U$ 联合起来，所反映的就是原始矩阵 $\bold A$ 中非0元素的位置，如此一来，在分解稀疏矩阵时经常出现的填补现象就被消除了。然而，精度却有所丧失导致达到收敛的迭代次数有所增加。为克服该缺陷，人们发展了更加精确的ILU分解方法，它们更加高效更加可靠。这些方法依据允许填补层次的不同，用 $I L U (p)$ 来定义填补的阶数。填补的阶数越高，ILU分解步骤代价越大。此外，当使用多重网格方法的时候（后面会讲到），ILU(0)方法作为光滑器（smoother）是绰绰有余的。正因为如此，这里就不展示高阶方法了。

ILU(0)分解算法假设 $\bold L$ 是个单位下三角矩阵，因此，可以把矩阵 $\bold L$ 和 $\bold U$ 还是存在矩阵 $\bold A$ 原本的位置上，该算法如下

3.7 ILU(0)分解算法

for k = 1 to N-1
{
	for i = k+1 to N and a_ik != 0
	{
		a_ik = a_ik / a_kk	// 这个是l矩阵的元素
		for j = k+1 to N and a_ij != 0
			a_ij = a_ij - a_ik * a_kj	// 这个是u矩阵的元素
	}
}

其实跟Gauss消元推出的LU分解一样，不过是判断了原矩阵的原始元素是否为0，如果是0就不处理了，仅此而已。

值的注意的是，对于对称正定矩阵的ILU分解被定义成了不完全Cholesky分解，此时，分解只需做下三角（或上三角）部分，对原矩阵的近似可以写为
$\overline \bold L ~ \overline \bold L ^\text T \approx \bold A$
其中 $\overline \bold L$ 是分解出来的稀疏下三角矩阵（矩阵 $\bold L$ 的近似），预处理矩阵 $\bold P$ 为
$\bold P = \overline \bold L ~ \overline \bold L ^\text T \approx \bold A$

3.8 ILU分解预处理器

基于ILU分解有很多好用的预处理器，前面提到直接解法中把稀疏矩阵 $\bold A$ 分解成下三角和上三角矩阵乘积的时候会出现填补现象。由于预处理器仅需要是矩阵 $\bold A^{-1}$ 的近似，因此，寻找矩阵 $\bold A$ 的近似分解就足够了，比如 $\bold A = \overline \bold L ~ \overline \bold U$ 。选择 $\bold P = \overline \bold L ~ \overline \bold U$ 将会使得 $\bold P^{-1}$ 的计算非常高效，因为该求逆可以用前向和后向回代来求出，如前所述，而此时精确的 $\bold L$ 和 $\bold U$ 已经分别被近似的 $\overline \bold L$ 和 $\overline \bold U$ 替代了。

对于ILU(0)方法，不完全分解减少了非零元素的稀疏度，预处理器与原矩阵的大小完全一样。为了减少存储量，Pommerell引入了ILU的简化版叫做对角ILU(DILU)，在DILU中非对角元的填补都被消去了（矩阵中的上下三角部分的元素保持不变），只有对角元素才被修改。

那么，预处理器可写成如下形式
$\bold P = (\bold D^* + \bold L)\bold D^{*-1}(\bold D^* + \bold U)$
其中 $\bold L$ 和 $\bold U$ 为矩阵 $\bold A$ 的上下三角分量（注意，不是LU分解，这里的L和U就是A中原本的上下三角部分的元素值），而 $\bold D^*$ 为规则的对角矩阵，但是与 $\bold A$ 的对角元素不同，矩阵 $\bold D^*$ 的定义是，让上式 $(\bold D^* + \bold L)\bold D^{*-1}(\bold D^* + \bold U)$ 的对角元等于 $\bold A$ 的对角元素。

3.9 计算DILU方法中D*的算法

for i = 1 to N
	d_ii = a_ii
for i = 1 to N
	for j = i+1 to N 且 a_ij != 0 且 a_ji != 0
		d_jj = d_jj - a_ji * a_ij / d_ii

为了求预处理器的逆，定义
$\bold P = (\bold D^* + \bold L)\bold D^{*-1}(\bold D^* + \bold U)=\overline\bold L~\overline\bold U,\quad \overline\bold L=(\bold D^* + \bold L)\bold D^{*-1},\quad \overline\bold U=(\bold D^* + \bold U)$
或
$\bold P = (\bold D^* + \bold L)(\bold I + \bold D^{*-1}\bold U)=\overline\bold L~\overline\bold U,\quad \overline\bold L=(\bold D^* + \bold L),\quad \overline\bold U=(\bold I + \bold D^{*-1}\bold U)$
这样在求解 $\bold P \boldsymbol \phi'^{(n+1)} = \bold r^{(n)}$ 时，需要用到修正场 $\boldsymbol \phi'^{(n+1)} = \bold P^{-1}\bold r^{(n)}$ ，就可以很方便地用前向和后向回代算法求出了。

3.10 DILU方法中的前向和后向回代算法

for i = 1 to N
	for j = 1 to i-1
		t_i = d_ii^-1 (r_i - l_ij * t_j)
for i = N to 1
	for j = i+1 to N
		phi'_i = t_i - d_ii^-1 (u_ij * t_j)

DILU的显著优势是，其仅需要存储一个额外的对角矩阵就行了。

3.11 求解代数系统的梯度方法

另一组求解线性代数方程组系统的迭代方法是梯度方法（Gradient Method），包含最速下降法（Steepest Descent）和共轭梯度方法（Conjugate Gradient）。它们最初是用于求解对称正定（SPD）矩阵 $\bold A$ 为系数的二次矢量函数的最小值问题，即
$\bold Q(\boldsymbol \phi) = \frac{1}{2}\boldsymbol \phi^T\bold A \boldsymbol \phi - \bold b^T \boldsymbol \phi + \bold c$
其中 $\bold c$ 为标量矢量， $\bold Q(\boldsymbol \phi)$ 的最小值对应的是其对 $\boldsymbol \phi$ 的梯度值是零。而矢量场 $\bold Q(\boldsymbol \phi)$ 在 $\boldsymbol \phi$ 处的梯度 $\bold Q'(\boldsymbol \phi)$ ，指向的正是 $\bold Q(\boldsymbol \phi)$ 的最大增长方向。梯度可算得
$\bold Q'(\boldsymbol \phi)=\frac{1}{2}\bold A^T \boldsymbol \phi +\frac{1}{2}\bold A \boldsymbol \phi - \bold b$
如果 $\bold A$ 是对称的（ $\bold A=\bold A^T$ ），则
$\bold Q'(\boldsymbol \phi)=\bold A \boldsymbol \phi - \bold b$
最小值是在 $\bold Q'(\boldsymbol \phi)=\bold 0$ 处获得的，有
$\bold Q'(\boldsymbol \phi)=\bold 0 \Rightarrow \bold A \boldsymbol \phi = \bold b$
因此， $\bold Q(\boldsymbol \phi)$ 的最小值问题对应的就是求解 $\bold A \boldsymbol \phi = \bold b$ 的问题，即该最小值问题的解和线性代数方程组的解是一样的。

还有个问题，要保证函数 $\bold Q(\boldsymbol \phi)$ 的最小值是全局最小值，需要系数矩阵 $\bold A$ 是正定的（positive definite），即，其应该对所有的 $\boldsymbol \phi \neq \bold 0$ 满足 $\boldsymbol \phi^T\bold A \boldsymbol \phi>0$ 。这一要求可通过考察精确解 $\boldsymbol \phi$ 与其当前预估值 $\boldsymbol \phi^{(n)}$ 的关系来阐明，令 $\bold e=\boldsymbol \phi^{(n)}-\boldsymbol \phi$ 代表精确值和当前值的差别，则
$\begin{aligned} \bold Q(\boldsymbol \phi + \bold e) & = \frac{1}{2}(\boldsymbol \phi + \bold e)^T\bold A (\boldsymbol \phi + \bold e) - \bold b^T (\boldsymbol \phi + \bold e) + \bold c \\ & = \frac{1}{2}\boldsymbol \phi^T\bold A \boldsymbol \phi + \frac{1}{2}\boldsymbol e^T\bold A \boldsymbol \phi + \frac{1}{2}\boldsymbol \phi^T\bold A \boldsymbol e + \frac{1}{2}\boldsymbol e^T\bold A \boldsymbol e - \bold b^T \boldsymbol \phi - \bold b^T \boldsymbol e + \bold c \\ & = \underbrace{\frac{1}{2}\boldsymbol \phi^T\bold A \boldsymbol \phi - \bold b^T \boldsymbol \phi + \bold c}_{\bold Q(\boldsymbol \phi)} + \frac{1}{2}(\boldsymbol e^T\bold A \boldsymbol \phi + \boldsymbol \phi^T\bold A \boldsymbol e) - \bold b^T \boldsymbol e + \frac{1}{2}\boldsymbol e^T\bold A \boldsymbol e \\ & = \bold Q(\boldsymbol \phi) + \frac{1}{2}\boldsymbol e^T\bold A \boldsymbol e \end{aligned}$
之所以消去了一些项，是因为
$\begin{aligned} \frac{1}{2}(\boldsymbol e^T\bold A \boldsymbol \phi + \boldsymbol \phi^T\bold A \boldsymbol e) - \bold b^T \boldsymbol e & = \frac{1}{2}((\bold A \boldsymbol \phi)^T \boldsymbol e + \boldsymbol \phi^T\bold A \boldsymbol e) - \bold b^T \boldsymbol e \\ & = \frac{1}{2}(\boldsymbol \phi^T \bold A^T \boldsymbol e + \boldsymbol \phi^T\bold A \boldsymbol e) - \bold b^T \boldsymbol e \\ & = \frac{1}{2}(\boldsymbol \phi^T \bold A \boldsymbol e + \boldsymbol \phi^T\bold A \boldsymbol e) - \bold b^T \boldsymbol e \\ & = \boldsymbol \phi^T\bold A \boldsymbol e - \bold b^T \boldsymbol e \\ & = \boldsymbol \phi^T\bold A^T \boldsymbol e - \bold b^T \boldsymbol e \\ & = (\boldsymbol \phi^T\bold A^T - \bold b^T) \boldsymbol e \\ & = (\bold A \boldsymbol \phi - \bold b)^T \boldsymbol e \\ & = \bold 0 \end{aligned}$
由 $\bold Q(\boldsymbol \phi + \bold e) = \bold Q(\boldsymbol \phi) + \frac{1}{2}\boldsymbol e^T\bold A \boldsymbol e$ 可见，如果 $\bold A$ 是正定的，那么第2项将永远是正值，除非 $\bold e=\bold 0$ ，即获得了所要的全局最小值。此外，如果 $\bold A$ 是正定的，它的所有特征值都是正的，且函数 $\bold Q(\boldsymbol \phi)$ 有唯一的最小值。

这样对于一个对称正定矩阵，可获得其收敛序列 $\boldsymbol \phi^{(n)}$ 如下
$\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)}(\delta \boldsymbol \phi^{(n)})$
其中 $\alpha^{(n)}$ 是松弛因子，而 $\delta \boldsymbol \phi^{(n)}$ 是与每步迭代过程中最小化函数 $\bold Q(\boldsymbol \phi)$ 的相关修正，当然这个式子的实现可以有很多方式，从而产生了不同的方法。

3.12 最速下降方法（The Method of Steepest Descent）

求解线性方程组系统的最速下降方法，是基于最小化式子 $\bold Q(\boldsymbol \phi) = \frac{1}{2}\boldsymbol \phi^T\bold A \boldsymbol \phi - \bold b^T \boldsymbol \phi + \bold c$ 中平方项的考虑。如果 $\boldsymbol \phi$ 是一维矢量，其分量为标量 $\phi$ ，那么函数 $\bold Q(\phi)$ 代表了一个抛物线，那么从某个初始点 $\phi_0$ 开始，找到该抛物线函数的最小值的方法，可以沿着该抛物线向下运动，直到碰到其底部最小值。

同样的思想可以应用于 $N$ 维系统，此时函数 $\bold Q( \boldsymbol \phi^{(n)})$ 描述的可能是一个抛物面，而从一个初始位置 $\boldsymbol \phi^{(0)}$ 开始的迭代求解过程，就可以是沿着该抛物面不断向下运动直到达到底部的最小值。为了获取更快的收敛序列， $\boldsymbol \phi^{(0)}, \boldsymbol \phi^{(1)}, \boldsymbol \phi^{(2)},...$ 应该选择最快速的下降方向，即，- $\bold Q'(\boldsymbol \phi)$ 。这个方向就是
$-\bold Q'(\boldsymbol \phi)= \bold b - \bold A \boldsymbol \phi$
精确解是 $\boldsymbol \phi$ ，则在第 $n$ 步的误差 $\bold e^{(n)}$ 和残差 $\bold r^{(n)}$ ，为
$\left. \begin{matrix} \bold e^{(n)} = \boldsymbol \phi^{(n)} - \boldsymbol \phi \\ \bold r^{(n)} = \bold b - \bold A \boldsymbol \phi^{(n)}=-\bold Q'(\boldsymbol \phi^{(n)}) \end{matrix} \right\} \Rightarrow \bold r^{(n)} = \bold A \boldsymbol \phi- \bold A \boldsymbol \phi^{(n)} = - \bold A \boldsymbol e^{(n)}$
那么，沿着最速下降方向， $\boldsymbol \phi^{(n+1)}$ 的值可由 $\boldsymbol \phi^{(n)}$ 的值写作
$\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold r^{(n)}$
$\alpha^{(n)}$ 的值是要让 $\bold Q(\boldsymbol \phi)$ 最小，所以
$\frac{d\left(\bold Q(\boldsymbol \phi^{(n+1)})\right) }{d\alpha^{(n)}} = 0$
即
$\frac{d\left(\bold Q(\boldsymbol \phi^{(n+1)})\right) }{d\alpha^{(n)}} = 0 \Rightarrow \left[ \frac{d\left(\bold Q(\boldsymbol \phi^{(n+1)})\right) }{d\boldsymbol \phi^{(n+1)}} \right]^T \frac{d\boldsymbol \phi^{(n+1)}}{d\alpha^{(n)}} \Rightarrow (\bold r^{(n+1)})^T\bold r^{(n)} = 0$
表明新迭代步的方向应该与老迭代步的方向相互垂直， $\alpha^{(n)}$ 的值可由上式计算
$\begin{aligned} (\bold r^{(n+1)})^T\bold r^{(n)} = 0 & \Rightarrow ( \bold b - \bold A \boldsymbol \phi ^{(n+1)})^T\bold r^{(n)} = 0 \\ & \Rightarrow [ \bold b - \bold A ( \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold r^{(n)})]^T\bold r^{(n)} = 0 \\ & \Rightarrow (\bold b - \bold A \boldsymbol \phi^{(n)})^T\bold r^{(n)} = \alpha^{(n)} ( \bold A \bold r^{(n)})^T \bold r^{(n)} \\ & \Rightarrow (\bold r^{(n)})^T\bold r^{(n)} = \alpha^{(n)} (\bold r^{(n)})^T\bold A\bold r^{(n)} \\ & \Rightarrow \alpha^{(n)} = \frac{(\bold r^{(n)})^T\bold r^{(n)}}{(\bold r^{(n)})^T\bold A\bold r^{(n)}} \\ \end{aligned}$
将最速下降算法的流程总结如下

选择残差作为起始方向 $\bold r^{(0)} = \bold b - \bold A \boldsymbol \phi^{(0)}$
第n步的迭代过程如下
2.1. 计算残差矢量 $\bold r^{(n)} = \bold b - \bold A \boldsymbol \phi^{(n)}$
2.2. 计算正交方向的比率 $\displaystyle \alpha^{(n)} = \frac{(\bold r^{(n)})^T\bold r^{(n)}}{(\bold r^{(n)})^T\bold A\bold r^{(n)}}$
2.3. 获取新值 $\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold r^{(n)}$

算法中的每个迭代步需要执行两次矩阵-矢量相乘，其中一个可以消去，即
$\begin{aligned} \boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold r^{(n)} & \Rightarrow \bold b - \bold A \boldsymbol \phi^{(n+1)} = \bold b - \bold A (\boldsymbol \phi^{(n)} + \alpha^{(n)} \bold r^{(n)}) \\ &\Rightarrow \boldsymbol r^{(n+1)}=\boldsymbol r{(n)}-\alpha^{(n)} \bold A \bold r^{(n)} \end{aligned}$
也就是说， $\bold r^{(n)}$ 只需要计算第1步的 $\bold r^{(0)}$ ，用 $\boldsymbol r^{(n+1)}=\boldsymbol r{(n)}-\alpha^{(n)} \bold A \bold r^{(n)}$ 就可以把后面的算出来了，这样子就不需要再计算 $\bold A \boldsymbol \phi^{(n)}$ ，因为算 $\bold A \bold r^{(n)}$ 就好了（残差矢量和正交方向比率都用这个来算，只用算一次就行了）。然而这样做的缺点在于缺乏从 $\boldsymbol\phi^{(n)}$ 向残差的反馈，有可能会因为圆整误差导致解收敛到一个不同于精确解的值，该缺陷可通过使用最初的方程定期计算残差来修复。

3.13 共轭梯度方法（The Conjugate Gradient Method）

虽然最速下降方法保证了收敛性，然而其收敛速度非常低。之所以会这样，是由于局部最小值附近的震荡导致该方法不断地在同一个方向搜索引起的，为避免这类问题，需要让每一次搜索的方向都跟前一次不一样才好。这可以通过选择一系列搜索方向 $\bold d^{(0)},\bold d^{(1)},\bold d^{(2)},...,\bold d^{(N-1)}$ ，让其是 $\bold A$ 正交的，两个矢量 $\bold d^{(m)}$ 和 $\bold d^{(n)}$ 如果满足如下关系则说它们是 $\bold A$ 正交的
$(\bold d^{(n)})^T \bold A \bold d^{(m)}=0$
如果在每次搜索方向都采用了正确的步长，那么解将会在第 $N$ 步收敛。

第n+1步的值为
$\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold d^{(n)}$
将 $\boldsymbol \phi$ 从上式两端减去，可得误差方程
$\boldsymbol e^{(n+1)} = \boldsymbol e^{(n)} + \alpha^{(n)} \bold d^{(n)}$
由于在前面最速下降算法中提到 $\bold r^{(n)} =- \bold A \boldsymbol e^{(n)}$ ，故
$\begin{aligned} \bold r^{(n+1)} &= - \bold A \boldsymbol e^{(n+1)} \\ &= - \bold A (\boldsymbol e^{(n)} + \alpha^{(n)} \bold d^{(n)}) \\ &= \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)} \end{aligned}$
上式表明，新残差 $\bold r^{(n+1)}$ 只是之前残差 $\bold r^{(n)}$ 和 $\bold A \bold d^{(n)}$ 的线性组合。

接下来需要让 $\boldsymbol e^{(n+1)}$ 和 $\bold d^{(n)}$ 是 $\bold A$ 正交的，这等效于沿着 $\bold d^{(n)}$ 方向搜索找到最小点，可推出 $\alpha^{(n)}$ 为
$\begin{aligned} (\bold d^{(n)})^T \bold A \bold e^{(n+1)}=0 & \Rightarrow (\bold d^{(n)})^T \bold A (\boldsymbol e^{(n)} + \alpha^{(n)} \bold d^{(n)})=0 \\ & \Rightarrow \alpha^{(n)} = \frac{(\bold d^{(n)})^T\bold r^{(n)}}{(\bold d^{(n)})^T \bold A \bold d^{(n)}} \end{aligned}$
上式也意味着
$(\bold d^{(n)})^T \bold A \bold e^{(n+1)}=0 \Rightarrow (\bold d^{(n)})^T \bold r^{(n+1)}= 0$
即，如果知道了搜索方向，那么可以算出 $\alpha^{(n)}$ 。

为了推导出搜索方向，假设其控制方程的形式为
$\bold d^{(n+1)} = \bold r^{(n+1)} + \beta^{(n)}\bold d^{(n)}$
$\bold d$ 矢量的 $\bold A$ 正交需要其满足
$(\bold d^{(n+1)})^T \bold A \bold d^{(n)}= 0$
结合上上式子，可得
$\beta^{(n)} =- \frac{(\bold r^{(n+1)})^T\bold A \bold d^{(n)}}{(\bold d^{(n)})^T \bold A \bold d^{(n)}}$
由于 $\bold r^{(n+1)} = \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)}$ ，得到
$\bold A \bold d^{(n)} = - \frac{1}{\alpha^{(n)} }(\bold r^{(n+1)} - \bold r^{(n)} )$
结合上式、上上式，以及 $\displaystyle \alpha^{(n)} = \frac{(\bold d^{(n)})^T\bold r^{(n)}}{(\bold d^{(n)})^T \bold A \bold d^{(n)}}$ ，可推得
$\begin{aligned} \beta^{(n)} &= \frac{(\bold r^{(n+1)})^T(\bold r^{(n+1)} - \bold r^{(n)} )}{(\bold d^{(n)})^T \bold A \bold d^{(n)}\alpha^{(n)}} \\ &= \frac{(\bold r^{(n+1)})^T(\bold r^{(n+1)} - \bold r^{(n)} )}{(\bold d^{(n)})^T \bold r^{(n)}} \\ & = \frac{(\bold r^{(n+1)})^T \bold r^{(n+1)} - \underbrace{\bold r^{(n+1))^T}\bold r^{(n)}}_{=0} }{(\bold d^{(n)})^T \bold r^{(n)}} \\ &= \frac{(\bold r^{(n+1)})^T \bold r^{(n+1)} }{（\bold d^{(n)})^T \bold r^{(n)}} \end{aligned}$
上式中的分母可进一步展开为
$\begin{aligned} (\bold d^{(n)})^T \bold r^{(n)} &= (\bold r^{(n)} + \beta^{(n-1)} \bold d^{(n-1)})^T \bold r^{(n)} \\ &= (\bold r^{(n)})^T \bold r^{(n)} + \beta^{(n-1)} \underbrace{(\bold d^{(n-1)})^T \bold r^{(n)}}_{=0} \\ &= (\bold r^{(n)})^T \bold r^{(n)} \end{aligned}$
因此，有
$\beta^{(n)} = \frac{(\bold r^{(n+1)})^T \bold r^{(n+1)} }{ (\bold r^{(n)})^T \bold r^{(n)} }$
共轭梯度（CG）算法流程为

选择残差作为初始方向 $\bold d^{(0)} = \bold r^{(0)} = \bold b - \bold A \boldsymbol \phi^{(0)}$
第n步的迭代过程如下
2.1. 选择 $\bold d$ 方向的比率因子 $\displaystyle \alpha^{(n)} = \frac{(\bold d^{(n)})^T\bold r^{(n)}}{(\bold d^{(n)})^T \bold A \bold d^{(n)}}$
2.2. 获得新的 $\boldsymbol \phi$ ，用 $\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold d^{(n)}$
2.3. 计算新残差 $\bold r^{(n+1)} = \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)}$
2.4. 计算共轭残差系数 $\displaystyle \beta^{(n)} = \frac{(\bold r^{(n+1)})^T \bold r^{(n+1)} }{ (\bold r^{(n)})^T \bold r^{(n)} }$
2.5. 获取新的共轭搜索方向 $\bold d^{(n+1)} = \bold r^{(n+1)} + \beta^{(n)}\bold d^{(n)}$

共轭梯度（CG）方法的收敛速度可以通过预处理来提高，这可以通过将原系统方程乘上一个预处理矩阵的逆矩阵 $\bold P^{-1}$ 来实现，其中 $\bold P$ 是对称正定矩阵，以便做预处理 $\bold P^{-1}\bold A\boldsymbol \phi = \bold P^{-1}\bold b$ 。问题在于，即便 $\bold P$ 和 $\bold A$ 都是对称的， $\bold P^{-1}\bold A$ 也未必是对称的，为了克服该问题，把 $\bold P$ 采用Cholesky分解成
$\bold P = \bold L \bold L ^T$
为了保证对称性，将系统方程写为
$\bold L ^{-1}\bold A\bold L ^{-T} \bold L ^{T}\boldsymbol \phi = \bold L ^{-1}\bold b$
其中 $\bold L ^{-1}\bold A\bold L ^{-T}$ 是对称和正定的。CG方法可用于求解 $\bold L ^{T}\boldsymbol \phi$ ，从而解出 $\boldsymbol \phi$ 。然而，通过替换，可以把 $\bold L$ 从方程中消去，而且不会影响到对称性和该方法的可靠性。通过对CG方法做一定的处理，便可获得预处理CG方法。

预处理CG方法（PCG）算法流程如下

选择初始方向 $\bold r^{(0)} = \bold b - \bold A \boldsymbol \phi^{(0)}$ 和 $\bold d^{(0)} =\bold P^{-1}\bold r^{(0)}$
第n步的迭代过程如下
2.1. 选择 $\bold d$ 方向的比率因子 $\displaystyle \alpha^{(n)} = \frac{(\bold r^{(n)})^T\bold P^{-1}\bold r^{(n)}}{(\bold d^{(n)})^T \bold A \bold d^{(n)}}$
2.2. 获得新的 $\boldsymbol \phi$ ，用 $\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold d^{(n)}$
2.3. 计算新残差 $\bold r^{(n+1)} = \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)}$
2.4. 计算共轭残差系数 $\displaystyle \beta^{(n+1)} = \frac{(\bold r^{(n+1)})^T \bold P^{-1} \bold r^{(n+1)} }{ (\bold r^{(n)})^T \bold P^{-1}\bold r^{(n)} }$
2.5. 获取新的共轭搜索方向 $\bold d^{(n+1)} = \bold P^{-1}\bold r^{(n+1)} + \beta^{(n+1)}\bold d^{(n)}$

实际上，有很多预处理的方法，较为简单的方法是选用原矩阵 $\bold A$ 的对角元素构建一个对角元矩阵（Jacobi pre-conditioner），较为复杂的方法是使用不完全Cholesky分解。无论如何，当CG方法用于大型矩阵求解时一定要采用预处理，毕竟能提高收敛效率不是。

3.14 双共轭梯度（BiCG）算法及其预处理器

一般来说，扩散方程、不可压缩的压力方程离散后的格式是对称的，可以用CG方法来求解，可是CFD的更加普遍的其它方程则不是对称的，就没法直接用CG方法了。但是CG方法的收敛实在是太快了，不用又怪可惜的。所以，要是能把不对称的矩阵转化成对称的矩阵，就能用CG方法了，有一种法子是这样的
$\begin{bmatrix} \bold 0 & \bold A \\ \bold A^T & \bold 0 \end{bmatrix} \begin{bmatrix} \hat{\boldsymbol \phi} \\ \boldsymbol \phi \end{bmatrix} = \begin{bmatrix} \bold b \\ \bold 0 \end{bmatrix}$
其中 $\hat{\boldsymbol \phi}$ 是虚假/伪变量，其添加只是为了让原本不对称的系统转化成对称系统，从而可以用CG方法求解。那么，CG方法现在求解了两个矢量，其中一个就是原方程 $\bold A \boldsymbol \phi = \bold b$ 要求解的矢量 $\boldsymbol \phi$ ，另一个则是不需要的伪矢量 $\hat{\boldsymbol \phi}$ （如果想算就把它算出来，如果不想算就不算它了）。因为要求解两个序列的矢量，所以这个方法便称之为双共轭梯度（BiCG）。

实际上基于这个思路提了很多BiCG方法，Lanczos提出的BiCG方法流程如下

选择初始方向 $\bold d^{(0)} = \bold r^{(0)} = \hat \bold d^{(0)} = \hat \bold r^{(0)} = \bold b - \bold A \boldsymbol \phi^{(0)}$
第n步的迭代过程如下
2.1. 选择 $\bold d$ 方向的比率因子 $\displaystyle \alpha^{(n)} = \frac{(\hat \bold r^{(n)})^T\bold r^{(n)}}{(\hat \bold d^{(n)})^T \bold A \bold d^{(n)}}$
2.2. 获得新的 $\boldsymbol \phi$ ，用 $\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold d^{(n)}$
2.3. 计算新残差 $\bold r^{(n+1)} = \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)}$
2.4. 计算新伪残差 $\hat \bold r^{(n+1)} = \hat \bold r^{(n)} - \alpha^{(n)} \bold A^T \hat\bold d^{(n)}$
2.5. 计算共轭残差系数 $\displaystyle \beta^{(n+1)} = \frac{(\hat \bold r^{(n+1)})^T \bold r^{(n+1)} }{ (\hat\bold r^{(n)})^T \bold r^{(n)} }$
2.6. 获取新的搜索方向 $\bold d^{(n+1)} = \bold r^{(n+1)} + \beta^{(n+1)}\bold d^{(n)}$
2.7. 获取新的伪搜索方向 $\hat\bold d^{(n+1)} = \hat\bold r^{(n+1)} + \beta^{(n+1)}\hat\bold d^{(n)}$

BiCG方法在每步迭代中需要对矩阵和矩阵的转置做两次相乘运算，这使得其计算量是CG方法的两倍。

BiCG方法当然也可以做预处理，跟预处理CG方法一样，Fletcher的方法流程如下（ $\bold P$ 代表预处理矩阵）：

选择初始方向 $\bold r^{(0)} = \hat \bold r^{(0)} = \bold b - \bold A \boldsymbol \phi^{(0)}$ ， $\bold d^{(0)} = \bold P^{-1}\bold r^{(0)}$ ， $\hat \bold d^{(0)} = \bold P^{-T}\hat \bold r^{(0)}$
第n步的迭代过程如下
2.1. 选择 $\bold d$ 方向的比率因子 $\displaystyle \alpha^{(n)} = \frac{(\hat \bold r^{(n)})^T\bold P^{-1}\bold r^{(n)}}{(\hat \bold d^{(n)})^T \bold A \bold d^{(n)}}$
2.2. 获得新的 $\boldsymbol \phi$ ，用 $\boldsymbol \phi^{(n+1)} = \boldsymbol \phi^{(n)} + \alpha^{(n)} \bold d^{(n)}$
2.3. 计算新残差 $\bold r^{(n+1)} = \bold r^{(n)} - \alpha^{(n)} \bold A \bold d^{(n)}$
2.4. 计算新伪残差 $\hat \bold r^{(n+1)} = \hat \bold r^{(n)} - \alpha^{(n)} \bold A^T \hat\bold d^{(n)}$
2.5. 计算共轭残差系数 $\displaystyle \beta^{(n+1)} = \frac{(\hat \bold r^{(n+1)})^T\bold P^{-1} \bold r^{(n+1)} }{ (\hat\bold r^{(n)})^T \bold P^{-1} \bold r^{(n)} }$
2.6. 获取新的搜索方向 $\bold d^{(n+1)} = \bold P^{-1}\bold r^{(n+1)} + \beta^{(n+1)}\bold d^{(n)}$
2.7. 获取新的伪搜索方向 $\hat\bold d^{(n+1)} = \bold P^{-1}\hat\bold r^{(n+1)} + \beta^{(n+1)}\hat\bold d^{(n)}$

BiCG方法的其它变种，更具稳定性和可靠性的，有Sonneveld的共轭梯度平方（CGS）、Van Der Vorst的双共轭梯度稳定（Bi-CGSTAB）、通用最小残差方法（GMRES），等。这些方法对于求解CFD当中出现的大型系统矩阵非常有用，可应用于结构和非结构网格所产生的非对称矩阵。

4 多重网格方法

迭代方法的收敛速度随着代数方程系统维数的增大而急剧恶化，这一情况即便是对于中等程度维数的系统也是存在的。这使得迭代方法的应用很受限制，幸运的是，人们很快发现把多重网格算法和迭代方法联合起来使用可以很好地克服该缺陷。

多重网格方法的提出源自于这些学者的贡献：Fedorenko（几何多重网格Geometric Multigrid）、Poussin（代数多重网格Algebraic Multigrid）、以及Settari和Azziz、还有Brandt在理论上的工作。尽管高频或振荡误差可以很容易地通过标准迭代方法（Jacobi、Gauss-Seidel、ILU）消除，然而这些求解方法无法轻易地去除光滑或低频误差分量。正因为如此，这些解法在多重网格方法中被定义成光滑器，下图展示了一维问题的误差频率模态的变化情况。

在这里插入图片描述
从上向下看，图中展示的误差模态从高频到低频，波长也从短 $\lambda_1$ 到长 $\lambda_5$ ，一维计算域采用一维网格离散，不同的模态分别绘制在同样的网格上。可见，高频误差的振荡发生在一个单元内部，其可以轻易地被迭代方法感受到。但是伴随着误差频率的降低，即，波长的增大，误差在网格上变得越来越光滑，在一个单元内部仅可感受到误差波长的一小部分，网格越是加密该问题反而越是严重，使得系统维数的增大导致方程数目的增多和收敛速率的恶化。

多重网格方法提高迭代求解器效率的法子是，确保在一个网格层级（level）上由于光滑器的应用所产生的低频误差，可以转化到，较粗糙网格层级上的高频误差。如图，通过使用多层次的粗细网格，多重网格方法能够克服收敛恶化的现象。

在这里插入图片描述

一般而言，粗网格可以用细网格的拓扑和几何关系来生成，这相当于在细网格的上面重新生成了一层粗网格；粗网格也可以直接通过细网格单元的聚合来生成，这样就是所谓的代数多重网格（Algebraic MutiGrid Method （AMG））。在AMG中，并不直接用到几何信息，聚合过程只是纯粹的代数处理，即通过聚合过程从细网格上的方程直接构建粗网格上的方程（并不需要重画网格啥的）。该方法可用于构造高效可靠的线性求解器，适用于高度各向异性网格或方程中系数变化很大的问题。

不管哪种方法，多重网格循环过程将用于遍历不同的网格层级。每次从细网格到粗网格的遍历包含：（i）限制（restriction）过程，（ii）设置或更新系统方程到粗网格，（iii）应用几次光滑迭代。每个从粗网格到细网格的遍历包含：（i）扩展（prolongation）过程，（ii）在细网格层级上的流场值修正，（iii）在限制过程中构造的方程上应用几次光滑迭代。下面将详细讲讲不同的步骤。

4.1 单元聚合/粗化（Element Agglomeration/Coarsening）

求解过程的首要任务是通过单元聚合/粗化来生成粗糙/细腻网格层级，有三种方法可以用来达成此目的。一，首先生成粗网格，然后再加密生成细网格，优点是粗-细网格关系非常好获取，缺点是细网格的分布要依赖于粗网格。二，使用非嵌套网格使得网格层级间的信息传递变得耗费较大（这个我确实没看明白，只好直译了）。这两种方法都不允许复杂区域有很好的分辨率。在第三种方法（推荐使用）中，由最精细的网格开始求解，然后通过把细网格单元做聚合处理来生成粗网格，如图所示，聚合的过程或者由单元的几何拓扑关系给出，或者是由与邻近单元的系数满足一定的判据来给出。以下的讨论都针对第三种方法。

在这里插入图片描述

粗网格是通过聚合算法把细网格单元汇聚起来生成的。对每个粗网格层级，该算法不断进行直到细网格层级的所有单元都与粗网格层级的单元相互关联为止。在该聚合过程中，细网格点被逐一访问，若某个单元被选中为种子（seed）单元，则其周围满足设定判据的邻居单元将会与该种子单元聚合形成一个粗单元。提前需要设定好融合成一个粗单元的细单元的最大数目。如果所选的种子单元没办法生成一个粗单元，那么把它加到其邻居单元中的最小粗单元中即可。

一个高效的聚合算法是直接聚合（DA）算法，由Mavriplis提出。在DA中，聚合由种子单元开始，将其与邻近的细单元，基于它们之间的几何关联强度做聚合。该过程仅需在求解开始前执行一次就好。

4.2 限制步和粗层次系数（The Restriction Step and Coarse Level Coefficients）

先在细网格上求解，执行几次迭代后，将误差转化或者说是限制到粗网格层级上，然后在粗网格上迭代几次，再往更高层级的网格上限制和求解，如此重复，直至达到最高或者说是最粗糙的网格层级。用(k)代表不同层级，则通过求解如下的系统方程可获得该层级的解
$\bold A^{(k)}\bold e^{(k)}=\bold r^{(k)}$
下一个粗糙层级是(k+1)，误差要限制到(k+1)层。令 $G_I$ 代表聚合成粗网格层级(k+1)上的I单元的细网格层级(k)上的i单元的集合，那么，在(k+1)层级要求解的系统是
$\bold A^{(k+1)}\bold e^{(k+1)}=\bold r^{(k+1)}$
上式右端项的残差为
$\bold r^{(k+1)}=\bold I_k^{k+1}\bold r^{(k)}$
其中 $\bold I_k^{k+1}$ 为限制算子（即，插值矩阵），其反映的是细网格到粗网格的聚合过程中残差的传递或者说转化特性。在AMG中，限制算子直接用线性形式定义，即等于细网格残差的加和
$\bold r^{(k+1)}_I=\sum_{i\in G_I}\bold r^{(k)}_i$
此外，粗网格单元的系数是由细网格单元的系数相加来构造的，再回顾下离散后所得的线性方程形式
$a_C\phi_C + \sum_{F\sim NB(C)}a_F\phi_F=b_C$
对于(k)层级，写成
$a_i^{(k)}\phi_i^{(k)} + \sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_{j}^{(k)}=b_{i}^{(k)}$
其中 $N B (i)$ 代表单元 $i$ 的邻近单元。当然一开始上式是不会满足的，会有如下的残差存在
$r_i^{(k)}=b_{i}^{(k)}-\left( a_i^{(k)}\phi_i^{(k)} + \sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_{j}^{(k)} \right)$
定义 $\phi_I^{(k+1)}$ 代表粗网格单元 $I$ 的解，且是要传递到细网格上去的，那么由粗网格给予细网格的修正可以写成
$\phi_i'^{(k)}=\phi_I^{(k+1)}-\phi_i^{(k)}$
当然我们希望修正能使得在粗网格的单元 $I$ 上的残差是0。将新残差用 $\tilde r_i^{(k)}$ 表示，其等于
$\tilde r_i^{(k)}=b_{i}^{(k)}-\left( a_i^{(k)}\left(\phi_i^{(k)}+\phi_i'^{(k)}\right) + \sum_{j\sim NB(i)}a_{ij}^{(k)}\left(\phi_j^{(k)}+\phi_j'^{(k)}\right)\right)$
等效于
$\begin{aligned} \tilde r_i^{(k)}&=\underbrace{b_{i}^{(k)}- \left(a_i^{(k)}\phi_i^{(k)}+\sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_j^{(k)}\right)}_{r_i^{(k)}} - \left(a_i^{(k)}\phi_i'^{(k)}+\sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_j'^{(k)}\right) \\ &=r_i^{(k)}-\left(a_i^{(k)}\phi_i'^{(k)}+\sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_j'^{(k)}\right) \end{aligned}$
强迫 $I$ 的残差加和为0，即
$\sum_{i\in G_I}\tilde \bold r^{(k)}_i=0$
得到
$0=\sum_{i\in G_I}\tilde \bold r_i^{(k)}-\left(\sum_{i\in G_I}a_i^{(k)}\phi_i'^{(k)}+\sum_{i\in G_I}\sum_{j\sim NB(i)}a_{ij}^{(k)}\phi_j'^{(k)}\right)$
将上式重写成粗网格形式，即，粗网格的修正方程
$a_I^{(k+1)}\phi_I'^{(k+1)} + \sum_{J\sim NB(I)}a_{IJ}^{(k+1)}\phi_{J}'^{(k+1)}=r_{I}^{(k+1)}$
其中 $a_I^{(k+1)}$ 、 $a_{IJ}^{(k+1)}$ 、 $r_{I}^{(k+1)}$ 是直接从细网格系数推导出来的，即
$\begin{aligned} & a_I^{(k+1)}=\sum_{i\in G_I}a_i^{(k)} + \sum_{i\in G_I}\sum_{j\in G_I}a_{ij}^{(k)} \\ & a_{IJ}^{(k+1)}=\sum_{i\in G_I}\sum_{j\notin G_I,~ j\in NB(I)}a_{ij}^{(k)} \\ & r_{I}^{(k+1)}=\sum_{i\in G_I}r_i^{(k)} \end{aligned}$

在这里插入图片描述

4.3 扩展步和细网格层级修正（The Prolongation Step and Fine Grid Level Corrections）

扩展算子用于把修正从粗网格转化到细网格层级上，有许多可用的算子，其中一个如图所示，为0阶扩展算子，其在细网格上产生同样的误差值，即，粗网格单元的误差将会被其在细网格层级上该单元的子单元所继承。

在这里插入图片描述

修正是从粗网格上的系统方程获取的，然后再插值到细网格层级上的
$\bold e^{(k)} = \bold I_{k+1}^{k} \bold e^{(k+1)}$
其中 $\bold I_{k+1}^{k}$ 为从粗网格到细网格的插值矩阵，最终，细网格上的解得以修正
$\bold \phi^{(k)} \leftarrow \bold \phi^{(k)} + \bold e^{(k)}$
网格层级的层数取决于网格的多寡，即便是多层的网格系统，其流程也和图中所展示的差不太多。

4.4 遍历策略和代数多重网格循环（Traversal Strategies and Algebraic Multigrid Cycles）

遍历策略指的是在求解过程中粗网格的访问方式，也被称之为多重网格循环。通常在AMG方法中用的循环是V循环、W循环、F循环，如图

在这里插入图片描述

AMG循环中最简单的是V循环，其对每层次的网格访问一次，对于刚性特别大的系统，V循环可能无法加速求解过程。因此，需要在粗网格上做较多求解，W循环实际上是在粗网格层级上做了些小的V循环，这样一来，W循环由嵌套的粗细网格层级扫描构成，随着AMG层数的增加其复杂性也有所增加。F循环是W循环的变种，其可视为把W循环劈开一半，F循环的粗网格扫描没W循环多，但是比V循环要多，因此，其介于V和W循环之间。

感觉书中对多重网格算法的讲解不是很透彻，看完也没能理解该如何应用，如何求解具体问题，所以准备找些材料弄明白后再单独讲讲这部分内容。