GaussSeidel迭代 Jacobi迭代及其收敛性

最新推荐文章于 2025-03-18 12:05:49 发布

我好方^-^

最新推荐文章于 2025-03-18 12:05:49 发布

阅读量9.5k

点赞数 10

分类专栏：迭代求解

本文链接：https://blog.csdn.net/qq_32507417/article/details/112288861

版权

迭代求解专栏收录该内容

1 篇文章

订阅专栏

本文介绍了Gauss-Seidel和Jacobi迭代法用于求解线性方程组的原理，包括矩阵形式和非矩阵形式的公式推导，并提供了稀疏矩阵下的Python代码示例。同时，讨论了两种方法的收敛性条件，指出当迭代矩阵的所有特征值的绝对值小于1时，迭代法收敛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

迭代法求解线性方程组

目的是对于一个可逆矩阵 $A$ ，利用迭代法求解

$A x = b .$

$G a u s s S e i d e l$ 和 $J a c o b i$ 都是将 $A$ 矩阵分成 $D + L + U$ 矩阵的形式，构造出 $x = G x + d$ 的迭代矩阵，来迭代求解出 $x$ ，理想情况下当 $x = = G x + d$ 时算法收敛，且此时 $\def\foo{A^{-1}} \foo b$ 。其中 $D L U$ 分别为 $A$ 矩阵的对角线矩阵，下三角矩阵和上三角矩阵。

在上述中介绍到两种方法都是通过定义迭代矩阵 $x = G x + d$ 来求解 $x$ 的。因此接下来分别介绍，GaussSeidel 和Jacobi分别时怎样定义迭代矩阵的。

$G a u s s S e i d e l$

公式推导

矩阵形式

$A = D + L + U$
$A x = b$
$(D + L + U) x = b$
$(D + L) x = - U x + b$
$-\def\foo{{(D+L)}^{-1}}\foo Ux + \def\foo{{(D+L)}^{-1}}\foo b$
$\implies x = Gx +d$
由上述推导可知，在 $G a u s s S e i d e l$ 中 $G=-\def\foo{{(D+L)}^{-1}}\foo U$ ， $\def\foo{{(D+L)}^{-1}}\foo b$

非矩阵形式

$x_{i}^{k} = \frac{1}{a_{ii}} (b- \sum_{0<j<i} {a_{ij} x_{j}^{k}}-\sum_{j>i} {a_{ij} x_{j}^{k-1}}) )$
其中 $x_{i}^{k}$ 代表 $x$ 的第 $i$ 个分量在第 $k$ 次迭代中的结果

代码示例

使用非矩阵形式实现在稀疏矩阵csr_matrix下实现的 $G a u s s S e i d e l$ 。

# A csr_matrix 
import sys
import copy
import numpy as np
import networkx as nx
from scipy.sparse import spdiags, tril, triu, coo_matrix, csr_matrix

def gauss_seidel(A, b, x0 = None, maxiter=20):
    # x0 = spsolve(A, b)
    if x0 is None:
        x0 =  np.array( [0.0]*A.shape[0]  )
    
    for _ in range(maxiter):
        n, _, indptr, indices, data = A.shape[0], A.nnz, A.indptr, A.indices, A.data
        for row in range(n):
            aii, sumi = 0.0, 0.0
            for j in range(indptr[row], indptr[row+1]):
                if row == indices[j]:
                    aii = 1.0/data[j]
                else:
                    sumi += data[j] * x0[ indices[j] ]
            x0[row] = (aii * (b[row] - sumi) )
    return x0
if __name__ == '__main__':  
    A = csr_matrix(([10,-2,-1, -2,10,-1, -1,-2,5], ([0,0,0,1,1,1,2,2,2], [0,1,2,0,1,2,0,1,2]) ) , shape=(3,3), dtype=np.float32)
    x = np.ones(A.shape[0])
    b = A.dot(x)
    xk = gauss_seidel(A, b)
    print(x)
    print(xk)

输出如下
在这里插入图片描述

$J a c o b i$

公式推导

矩阵形式

$A = D + L + U$
$A x = b$
$(D + L + U) x = b$
$D x = - （ L + U) x + b$
$-\def\foo{D^{-1}}\foo (L+U)x + \def\foo{D^{-1}}\foo b$
$\implies x = Gx +d$
由上述推导可知，在Jacobi中 $G=-\def\foo{D^{-1}}\foo (L+U)$ ， $\def\foo{D^{-1}}\foo b$

非矩阵形式

$x_{i}^{k}= \frac{1}{a_{ii}}(b-\sum_{j!=i} {a_{ij} x_{j}^{k-1}})$

代码示例

使用矩阵形式实现在稀疏矩阵csr_matrix下实现的 $J a c o b i$ 。

# A csr_matrix
import sys
import copy
import numpy as np
from scipy.sparse import spdiags, tril, triu, coo_matrix, csr_matrix
def jacobi(A, b, x0 = None, maxiter=20):
    if x0 is None:
        x0 =  np.array( [0.0]*A.shape[0]  )

    D = spdiags(A.diagonal(), np.array([0]), A.shape[0], A.shape[1]) # default with <class 'scipy.sparse.dia.dia_matrix'> 

    L = tril(A) - D
    U = triu(A) - D 

    dia = generate_dia_inv(D)
    B = -( dia ).dot(L+U)
    f = ( dia ).dot(b)

    for _ in range(maxiter):
        x0 = B.dot(x0) + f
    return x0
def generate_dia_inv(mat):
    res_dia = mat.diagonal()
    res_dia = 1.0/res_dia
    res_mat = csr_matrix((res_dia.shape[0], res_dia.shape[0]))
    res_mat.setdiag(res_dia)
    return res_mat
if __name__ == '__main__':  
    A = csr_matrix(([10,-2,-1, -2,10,-1, -1,-2,5], ([0,0,0,1,1,1,2,2,2], [0,1,2,0,1,2,0,1,2]) ) , shape=(3,3), dtype=np.float32)
    x = np.ones(A.shape[0])
    b = A.dot(x)
    xk = jacobi(A, b)
    print(x)
    print(xk)

输出如下
在这里插入图片描述

收敛性

因为两种方法的根本思想是一致的，都是通过迭代公式 $x = G x + d$ 来求解 $x$ 。所以直接通过此迭代公式来看两种方法收敛的条件。
令误差向量 $\def\foo{e^{i}}\foo = \def\foo{x^{i}}\foo-x$ ，其中 $x$ 是 $A x = b$ 的精确解， $\def\foo{e^{i}}\foo$ 是 $G a u s s S e i d e l$ 或者 $J a c o c i$ 第 $i$ 次迭代所求解。

收敛性证明
由于 $\def\foo{x^{i}}\foo = G\def\foo{x^{i-1}}\foo+d$
且 $x = G x + d$
所以有， $\def\foo{e^{i}}\foo = G\def\foo{e^{i-1}}\foo$
且 $\def\foo{e^{i-1}}\foo = G\def\foo{e^{i-2}}\foo$
$. . .$
因此， $\def\foo{e^{i}}\foo = \def\foo{G^{i}}\foo\def\foo{e^{0}}\foo$
当迭代法收敛时，就意味着 $\lim\limits_{i\rarr\infin}\def\foo{e^{i}}\foo\rarr0$
由特征值和特征向量的定义可知 $G\zeta_i=\lambda_i\zeta_i$ ，且特征向量之间线性无关
因此 $\def\foo{e^{0}}\foo=\Sigma\delta_k\zeta_k$ , 可以这样表示，且 $\delta_k$ 是定值
则 $\def\foo{e^{1}}\foo = \def\foo{G}\foo\def\foo{e^{0}}\foo = G \sum\delta_k\zeta_k = \sum\delta_kG \zeta_k = \sum\delta_k \lambda_k \zeta_k$ ，由 $G\zeta_i=\lambda_i\zeta_i$ 得。
则 $\def\foo{e^{2}}\foo= \sum\delta_k \lambda_k^{2} \zeta_k$ , $\def\foo{e^{3}}\foo= \sum\delta_k \lambda_k^{3} \zeta_k$ …
那么 $\lim\limits_{i\rarr\infin}\def\foo{e^{i}}\foo =\lim\limits_{i\rarr\infin} \sum \lambda_k^{i} \delta_k\zeta_k$
其中 $\delta_k\zeta_k$ 是定值
则当 $abs(\lambda_k) > 1 \implies\lim\limits_{i\rarr\infin}\def\foo{e^{i}}\foo\rarr\infin$
当 $abs(\lambda_k) < 1 \implies\lim\limits_{i\rarr\infin}\def\foo{e^{i}}\foo\rarr0$
综上，当迭代矩阵 $G$ 的所有特征值 $abs(\lambda_k) < 1$ 时，该迭代方法收敛。