A block IDR(s) method for nonsymmetric linear systems with multiple right-hand sides

OFF JUMPOL

已于 2022-04-29 17:55:24 修改

阅读量284

点赞数

分类专栏：矩阵

于 2022-04-29 09:03:05 首次发布

本文链接：https://blog.csdn.net/qq_34179307/article/details/124485340

版权

诱导降维块IDR(s) 非对称系统多右侧块Krylov子空间

关键词由CSDN通过智能技术生成

矩阵专栏收录该内容

7 篇文章 0 订阅

订阅专栏

基于诱导降维（IDR）定理的IDR（s）是一类新的求解大型非对称线性系统的有效算法。本文将IDR（s）推广到求解具有多个右边的大型非对称线性系统。

本文首先给出了IDR定理的一个变体，然后在变体IDR（s）定理的基础上提出了块IDR（s）。

1. Introduction

考虑求解具有多个右侧边的大的稀疏线性系统
$\tag{1}$

系数矩阵A是n阶非奇异实数矩阵，, $X = [x_1, x_2, . . . , x_m]$ and $B = [b_1, b_2, . . . , b_m] ∈ R^{n×m}$ (m ≪ n)

本文的其余部分组织如下。在下一节中，我们将回顾块Krylov子空间和IDR(s)。然后，我们将给出IDR定理的一个变体，它是IDR定理的推广和我们的块IDR(s)算法的理论基础，并在第3节中分析块方法。在第4节中，一些数值结果证明了该方法的有效性。最后，我们在第5节中作了一些总结性。

符号。 $M_{n×n}$ ， $N_{n×m}$ 表示矩阵。如果一个矩阵的维数从上下文中是明显的，并且没有混淆，我们将去掉索引，用 $M$ 表示 $M_{n×n}$ 。 $M^H$ 是M的厄米特转置。

$‖M‖^2_F=Tr(M^{H}M)$ ，其中 $_F$ 和 $T r (\cdot)$ 分别表示方阵的F范数和迹。除非另有说明，‖·‖是贯穿整个论文的欧几里得范数。
$\mathcal{N} (M)$ 表示矩阵M的空空间。

2. The block Krylov subspace and IDR(s)

2.1. Block Krylov subspace

设 $X_0∈R^{n×m}$ 为初始猜测， $R_0=B−AX_0$ 为对应的块残差矩阵。

Definition 2.1 由 $A$ 产生的子空间 $\mathcal{K}_k(A，R_0)$ 和A应用于 $R_0$ 的升幂

被称为块Krylov子空间。

矩阵Krylov子空间，其定义如下。
Definition 2.2 由 $A$ 产生的子空间 $\mathbb{K}_k(A，R_0)$ 和A应用于 $R_0$ 的升幂

Definition 2.3 正整数 $v := v(R_0, A)$ ，定义为

对于A，被称为 $R_0$ 的块级。

Corollary 2.4 设 $X_∗$ 是 $A X = B$ 的精确块解

用于寻找近似解的方法 $X_{k} \in X_{0}+\mathcal{K}_{k}\left(A, R_{0}\right)$ 被称为块方法，选择 $X_{k} \in X_{0}+\mathbb{K}_{k}\left(A, R_{0}\right)$ 导致所谓的全局方法. 如果我们选择 $\gamma_{i}=\alpha_{i} I_{m \times m}(i=0,1, \ldots, k-1), \mathbb{K}_{k}$ and $\mathcal{K}_{k}$ 可以是同一个子空间。由此看来，矩阵 Krylov 子空间 $\mathbb{K}_{k}\left(A, R_{0}\right)$ 可以认为是块 Krylov 子空间的子空间 $\mathcal{K}_{k}\left(A, R_{0}\right)$ , i.e. $\mathbb{K}_{k}\left(A, R_{0}\right) \subset \mathcal{K}_{k}\left(A, R_{0}\right)$ .

对于块求解器，让 $Z=\left[z_{1}, z_{2}, \ldots, z_{m}\right] \in \mathcal{K}_{k}$ , where $z_{i} \in \mathbb{R}^{n}(i=1, \ldots, m)$ . F从(2)的定义来看，有 $\gamma_{j}{ }^{\prime} s \in \mathbb{R}^{m \times m}(j=0, \ldots, k-1)$ 满足
$Z=\sum_{j=0}^{k-1} A^{j} R_{0} \gamma_{j}$
这意味着
$z_{i}=\sum_{l=1}^{m} \sum_{j=0}^{k-1} \gamma_{j}(l, i) A^{j} R_{0}(:, l) \in \mathscr{B}_{k}\left(A, R_{0}\right)$
where $\mathscr{B}_{k}\left(A, R_{0}\right):=\mathcal{K}_{k}\left(A, R_{0}(:, 1)\right)+\cdots+\mathcal{K}_{k}\left(A, R_{0}(:, m)\right)$ .
所以 $X_{k}=X_{0}+Z \in \mathcal{K}_{k}$ 的列对应于 $m$ 单右手线性系统的近似解。但是，与标准 Krylov 求解器不同，块 Krylov 求解器在每个右侧的搜索空间要大得多，即,近似解 $X_{k}(:, l)=X_{0}(:, l)+\mathcal{B}_{k}\left(A, R_{0}\right)$ are updated instead of $X_{k}(:, l)=X_{0}(:, l)+\mathcal{K}_{k}\left(A, R_{0}(:, l)\right)$ . 这是使用块方法的主要原因。

2.2. IDR(s)

Theorem 2.5 (IDR). 设 $\in \mathbb{C}^{n \times n}, v_{0} \in \mathbb{C}^{n}$ , and $g_{0}=\mathcal{K}_{v}\left(A, v_{0}\right)$ . 设 $\subset \mathbb{C}^{n}$ 并定义递归子空间 $g_{j}$ 为
$g_{j}=\left(I-\omega_{j} A\right)\left(g_{j-1} \cap S\right), \quad\left(\omega_{j} \neq 0\right) \in \mathbb{C}, j=1,2, \ldots$
如果 $g_{0} \cap S$ 不包含 $A$ ,的任何特征向量，则保持如下：
(a) $g_{j} \subset g_{j-1}, \forall j>0$ .
(b) $\mathcal{g}_{j}=\{0\}$ for some $\leq n$ .

从该定理中，我们知道级数嵌套子空间的维数随着序列子空间 $g_{j}$ 的缩小而减小。如果所有的剩余 $r_is$ 都可以在嵌套的子空间 $g_{j}$ 中构造，我们可以在有限步长中得到近似解。在IDR(s)方法[23]的一般情况下，最多需要 $n + n / s$ 个矩阵向量积。

s+2项IDR(s)算法可以作为IDR定理的推导如下。
在这里插入图片描述
要初始化 $r_1,…,r_s$ ，可以使用任何相当迭代的方法，例如，BiCGStab

然后，从方程(3)(4)，近似解 $x_{i+1}$ 可以更新为

为了确定 $s$ 个变量 $\gamma_j$ ，可以选择空间 $S$ 为某些 $n \times s$ 矩阵的左空空间， $P = [p_1, . . . , p_s]$ , i.e., $S = N (P^H )$ ,这可以随机生成，因为空间 $S∩g_0$ 包含A的一些特征向量(s)的概率为零[23]。然后可以从方程中求解 $\gamma_j$
$P^H v_i = 0.$

在形成整个算法之前，还需要计算一个参数 $ω_{j+1}$ ，[23]建议通过每 $s + 1$ 步最小化残差 $r_{i+1}$ 的范数来选择 $ω$ 。
在这里插入图片描述

3. The block IDR(s)

在本节中，我们考虑具有多个右侧的非对称线性系统。为了提出IDR(s)的块版本，我们首先给出了IDR定理的一个变体，它是在第3.1节中对IDR定理的一个扩展。为了从变体IDR定理中给出一个可执行的过程，我们分别在第3.2节和第3.3节中讨论了实现细节，并阐述了所提出的算法。然后，在第3.4节中，我们比较了IDR(s)和块IDR(s)之间的计算成本和内存需求，并分析了通过矩阵向量运算计算的收敛性。最后，在第3.5节中给出了一个块IDR(s)算法的预处理版本。