高阶稀疏矩阵的迭代求解方法

已知线性方程组的矩阵表示形式为:
A x = b Ax=b Ax=b
当矩阵 A A A为低阶稠密矩阵时,通常可以采用直接法-矩阵分解,将矩阵直接进行分解,然后求解;
当矩阵为高阶稀疏矩阵时(含有较多0元素),通常采用迭代法,如雅克比(Jacobi)迭代法、高斯-赛德尔(Gauss-Seidel)迭代法、超松弛(SOR)迭代法等,对于迭代法,将会面临收敛性问题。即随着迭代次数的增加,误差并不会较小,反而不断增加。

本文分别对雅克比迭代法、高斯-赛德尔迭代法和超松弛迭代法,用矩阵形式进行表示,并分析它们的收敛性。

全文定义

  • 线性方程组: A x = b Ax=b Ax=b
  • 迭代公式: x k + 1 = B x k + g x^{k+1}=Bx^{k}+g xk+1=Bxk+g
  • 对于迭代公式 x k + 1 = B x k + g x^{k+1}=Bx^{k}+g xk+1=Bxk+g收敛的充分必要条件是跌倒矩阵 B B B的谱半径 ρ ( G ) < 1 \rho(G)<1 ρ(G)<1
  • 如果迭代矩阵的某种范数 ∣ ∣ B ∣ ∣ < 1 ||B||<1 B<1,则迭代公式 x k + 1 = B x k + g x^{k+1}=Bx^{k}+g xk+1=Bxk+g收敛
  • 对角占优的线性方程组 A x = b Ax=b Ax=b的雅克比迭代公式和高斯-赛德尔迭代公式都收敛。
  • 若系数矩阵 A A A是对称正定矩阵,则高斯-赛德尔迭代公式收敛

补充

  • 谱半径:矩阵 A A A的谱半径 ρ ( A ) \rho(A) ρ(A)就是矩阵 A A A的特征值的模的最大值。设 A A A n n n阶方阵, λ i \lambda _i λi是其特征值,则 ρ ( A ) = m a x { ∣ λ i ∣ } \rho(A) = max\{|\lambda_i|\} ρ(A)=max{λi}
  • 矩阵范数:

定义一个矩阵 A = [ − 1 2 − 3 4 − 6 6 ] A = \begin{bmatrix} -1&2&-3\\ 4&-6&6 \end{bmatrix} A=[142636]

  • 1范数:矩阵的每一列上的元素绝对值先求和,再从中取个最大的(列和最大),上述矩阵A的1范数先得到[5,8,9],再取最大的最终结果就是:9。
  • 2范数:矩阵 A T A A^TA ATA的最大特征值开平方根,上述矩阵A的2范数得到的最大结果是:10.0623。
  • 无穷范数:矩阵的每一行上的元素绝对值先求和,再从中取个最大的,(行和最大),上述矩阵A的1范数先得到[6;16],再取最大的最终结果就是:16。
  • 核范数:矩阵的奇异值(将矩阵 S V D SVD SVD分解)之和,这个范数可以用来低秩表示(因为最小化核范数,相当于最小化矩阵的秩–低秩),上述矩阵A的最终结果就是10.9287。
  • L 0 L_0 L0范数:矩阵的非0元素的个数,通常用它来表示稀疏,L0范数越小0元素越多,也就越稀疏,上述矩阵A最终结果就是:6。
  • L 1 L_1 L1范数:矩阵中的每个元素绝对值之和,它是 L 0 L_0 L0范数的最优凸近似,因此它也可以表示稀疏,上述矩阵A最终结果就是:22。
  • F F F范数:矩阵的各个元素平方之和再开平方根,它通常也叫做矩阵的 L 2 L_2 L2范数,它的优点在它是一个凸函数,可以求导求解,易于计算,上述矩阵A最终结果就是10.0995。
  • L 21 L_{21} L21范数:矩阵先以每一列为单位,求每一列的 F F F范数(也可认为是向量的2范数),然后再将得到的结果求 L 1 L_1 L1范数(也可以认为是向量的1范数),很容易看出它是介于 L 1 L_1 L1 L 2 L_2 L2之间的一种范数,上述矩阵A最终结果就是:17.1559。

1 雅克比迭代法

1.1 矩阵表示

雅克比迭代法,假设系数矩阵 A A A非奇异,并且主对角线上的元素不等于0.
因此可将 A A A矩阵进行分解:
A = L + D + U A = L+D+U A=L+D+U
其中
L L L为下三角矩阵,下三角各元素对应于系数矩阵 A A A下三角上的元素,并且主对角线上的元素为0;
D D D为对角矩阵,主对角线上的元素即为系数矩阵 A A A对角线上的元素。
U U U为上三角矩阵,上三角各元素对应于系数矩阵 A A A上三角上的元素,并且主对角线上的元素为0;

通过推导,可得雅克比迭代法的迭代公式为:
x k + 1 = B x k + g B = ( I − D − 1 A ) g = D − 1 b x k + 1 = ( I − D − 1 A ) x k + D − 1 b x^{k+1}=Bx^{k}+g\\B=(I-D^{-1}A)\\g=D^{-1}b\\x^{k+1} = (I-D^{-1}A)x^{k}+D^{-1}b xk+1=Bxk+gB=(ID1A)g=D1bxk+1=(ID1A)xk+D1b
其中:矩阵 B B B称为雅克比迭代矩阵。

1.2 雅克比迭代法分量表示

在这里插入图片描述
雅克比迭代法的矩阵表示法,主要用来讨论起收敛性;实际计算中,要用雅克比迭代法公式的分量形式。
在这里插入图片描述

2 高斯-赛德尔迭代法

2.1 矩阵表示

A x = b = ( L + D + u ) x D x k + 1 = − L x k + 1 − U x k + b Ax=b=(L+D+u)x\\ Dx^{k+1}=-Lx^{k+1}-Ux^{k}+b Ax=b=(L+D+u)xDxk+1=Lxk+1Uxk+b
因此高斯-赛德尔迭代法的矩阵表示为:
x k + 1 = B x k + g x k + 1 = − ( D + L ) − 1 U x k + ( D + L ) − 1 b B = − ( D + L ) − 1 U g = ( D + L ) − 1 b x^{k+1}=Bx^{k}+g\\x^{k+1} = -(D+L)^{-1}Ux^{k}+(D+L)^{-1}b\\ B=-(D+L)^{-1}U\\ g=(D+L)^{-1}b xk+1=Bxk+gxk+1=(D+L)1Uxk+(D+L)1bB=(D+L)1Ug=(D+L)1b

2.2 高斯-赛德尔迭代法的分量表示:

在这里插入图片描述
它充分了利用了本次迭代计算的结果,即计算 x k + 1 x^{k+1} xk+1的第 i i i个分量时,由于它需要知道,此时其它分量的值,对于排在它之前的分量 x j k + 1 ( j < i ) x_j^{k+1}(j<i) xjk+1(j<i),由于在本次迭代过程中,已经计算出来本次迭代的结果,因此该分量 x i k + 1 x_i^{k+1} xik+1将会利用到 x j k + 1 ( j < i ) x_j^{k+1}(j<i) xjk+1(j<i);而对于排在它之后的分量 j > i j>i j>i,因为本次迭代还未轮到它的计算,因此对于 x i k + 1 x_i^{k+1} xik+1的计算,只用利用第 j j j分分量上一次迭代的结果 x j k x_j^{k} xjk

3 逐次超松弛迭代法

S O R SOR SOR迭代法是高斯-赛德尔迭代法的一种修正,它通过 x k x^{k} xk计算 x k + 1 x^{k+1} xk+1的步骤和迭代公式为:

  1. 利用高斯迭代法求得辅助量
    在这里插入图片描述
  2. x i k x_i^{k} xik做加权平均

在这里插入图片描述
整合为一个公式即为:

在这里插入图片描述
其中: ω \omega ω为松弛因子。

3.1 S O R SOR SOR迭代法的矩阵表示

x k + 1 = B x k + g x k + 1 = ( D − ω L ) − 1 [ ( 1 − ω ) D + ω U ] x k + ω ( D − ω L ) − 1 b B = ( D − ω L ) − 1 [ ( 1 − ω ) D + ω U ] g = ω ( D − ω L ) − 1 x^{k+1} = Bx^{k}+g\\ x^{k+1} = (D-\omega L)^{-1}[(1-\omega)D+\omega U]x^{k}+\omega (D-\omega L)^{-1} b\\ B = (D-\omega L)^{-1}[(1-\omega)D+\omega U]\\g=\omega (D-\omega L)^{-1} xk+1=Bxk+gxk+1=(DωL)1[(1ω)D+ωU]xk+ω(DωL)1bB=(DωL)1[(1ω)D+ωU]g=ω(DωL)1

  • ω = 1 \omega =1 ω=1时,即为高斯-赛德尔迭代法
  • S O R SOR SOR迭代法每次迭代法的主要运算量为矩阵和向量的乘法
  • ω > 1 \omega>1 ω>1时,称为超松弛迭代法;当 ω < 1 \omega <1 ω<1时,称为低松弛迭代法。对于特定线性方程组的求解,合理选择松弛因子 ω \omega ω的大小,将会使得 S O R SOR SOR收敛大大加速。

S O R SOR SOR 迭代法的定理:

  • 若矩阵 A A A为对称正定矩阵,当 0 < ω < 2 0<\omega<2 0<ω<2时, S O R SOR SOR迭代法是收敛的
  • 若矩阵 A A A是严格的对角占优矩阵,当 0 < ω < 1 0<\omega<1 0<ω<1时,, S O R SOR SOR迭代法是收敛的

4 迭代终止条件

在这里插入图片描述
或者
在这里插入图片描述
对于 x x x的每一个分量 x i x_i xi,它们的迭代次数 k k k可能是不同的。因此不能通过矩阵形式直接求解。

5 代码实现

5.1 实现雅克比迭代法

#include<iostream>
#include<Eigen/Core>
#include<Eigen/Dense>
#include<chrono>

using namespace std;

typedef Eigen::Matrix<float, 6, 6>Matrix6f;
typedef Eigen::Matrix<float, 6, 1>Vector6f;
const double e = 0.000001; //最大误差
int main(int argc, char** argv)
{
	Matrix6f A;
	A << 4, -1, 0, -1, 0, 0,
		-1, 4, -1, 0, -1, 0,
		0, -1, 4, -1, 0, -1,
		-1, 0, -1, 4, -1, 0,
		0, -1, 0, -1, 4, -1,
		0, 0, -1, 0, -1, 4;
	Vector6f b;
	b << 0, 5, -2, 5, -2, 6;

	//cout << A << endl;
	//cout << b << endl;
	double er=1;
	//构造雅克比迭代公式
	Vector6f xk = Vector6f::Zero(); //将迭代初始值设为0
	int k = 0; //计算迭代的次数
	chrono::steady_clock::time_point t1 = chrono::steady_clock::now();
	while (er>e)
	{
		er = 0;
		Vector6f  xk_1;
		Vector6f index;
		for (int i = 0; i < A.cols(); i++)
		{
			index = Vector6f::Zero();
			for (int j = 0; j < A.cols(); j++)
			{
				if (j != i)
				{
					index(i,0) = index(i,0) + A(i,j) * xk(j,0);
				}
			}
			xk_1(i,0) = (b(i,0) - index(i,0)) / A(i,i);
		}
		//计算误差
		er = (xk - xk_1).dot(xk - xk_1) / 6;
		xk = xk_1;
		k++;
	}
	chrono::steady_clock::time_point t2 = chrono::steady_clock::now();
	//计算迭代法的时间
	chrono::duration<float> time1 = chrono::duration_cast<chrono::duration<float>>(t2 - t1);
	cout << "迭代的次数:";
	cout << k << endl;
	cout << "迭代的时间为:" << time1.count()<<"秒"<<endl;
	cout << "结果:" << endl;
	cout << xk;
	cout << endl;
	cout << "=====================";
	cout << endl;

	//与直接三角分级法相比
	Eigen::FullPivLU<Matrix6f>lu(A);

	chrono::steady_clock::time_point t3 = chrono::steady_clock::now();
	Vector6f lx = lu.solve(b);
	chrono::steady_clock::time_point t4 = chrono::steady_clock::now();
	chrono::duration<float> time2 = chrono::duration_cast<chrono::duration<float>>(t4 - t3);
	cout << "通过三角分解法,LU的计算时间为:" << time2.count();
	cout << endl;
	cout << "计算结果为:" << endl;
	cout << lx << endl;
	cout << endl;
	system("pause");
	return 0;
}

计算结果为:

迭代的次数:20
迭代的时间为:0.0014122秒
结果:
0.999615
 1.99895
0.999474
 1.99895
0.999474
 1.99923
=====================
通过三角分解法,LU的计算时间为:0.0001018
计算结果为:
1
2
1
2
1
2

5.2 实现高斯-赛德尔迭代法

//实现Gauss-Seidel迭代法
#include<iostream>
#include<Eigen/Core>
#include<Eigen/Dense>
#include<chrono>

using namespace std;

const double er = 0.0001;
typedef Eigen::Matrix<float, 6, 6> Matrix6f;
typedef Eigen::Matrix<float, 6, 1>Vector6f;
//Vector6f GS(const Matrix6f&, const Vector6f&); //高斯-赛德尔迭代函数声明

int main(int argc, char** argv)
{
	//构造数据
	Matrix6f A;
	Vector6f b;
	A << 4, -1, 0, -1, 0, 0,
		-1, 4, -1, 0, -1, 0,
		0, -1, 4, -1, 0, -1,
		-1, 0, -1, 4, -1, 0,
		0, -1, 0, -1, 4, -1,
		0, 0, -1, 0, -1, 4;
	b << 0, 5, -2, 5, -2, 6;
	
	//使用高斯-赛德尔迭代法计算线性方程组的解
	//定义初始解
	Vector6f x0 = Vector6f::Zero();
	Vector6f index = Vector6f::Zero();
	double e = 1;
	//计数迭代次数
	int k = 0;
	chrono::steady_clock::time_point t1 = chrono::steady_clock::now();
	while (e > er)
	{
		e = 0;
		for (int i =0;i< A.cols(); i++)
		{
			index = Vector6f::Zero();
			for (int j = 0; j < A.cols(); j++)
			{
				if (j != i)
				{
					index(i, 0) += A(i, j)*x0(j, 0);
				}
			}
			x0(i, 0) = (b(i, 0) - index(i, 0)) / A(i, i);
		}
		//计算误差
		Vector6f new_b = A * x0;
		e = (new_b - b).dot(new_b - b) / 6;
		k += 1;
	}
	chrono::steady_clock::time_point t2 = chrono::steady_clock::now();
	cout << "Gauss-Seidel迭代法和Jacobi迭代法" << endl;
	cout << "===================================" << endl;
	cout << "高斯-赛德尔迭代法" << endl;
	cout << "计算的结果为:" << endl;
	cout << x0 << endl;
	//cout << result << endl;
	cout << "Ax=" << endl;
	//cout << A * result << endl;
	cout << A * x0 << endl;
	cout << "迭代的次数为:" << k << endl;
	double time1 = chrono::duration_cast<chrono::duration<double>>(t2 - t1).count();
	cout << "迭代的时间为:" << time1<<endl;
	cout << "====================================" << endl;

	//Jacobi迭代法
	int kj = 0;
	Vector6f xj = Vector6f::Zero();
	Vector6f xj_1;
	Vector6f index1 = Vector6f::Zero();
	double ej = 1;
	chrono::steady_clock::time_point t3 = chrono::steady_clock::now();
	while (ej > er)
	{
		ej = 0;
		for (int i = 0; i < A.cols(); i++)
		{
			index1 = Vector6f::Zero();
			for (int j = 0; j < A.cols(); j++)
			{
				if (i != j)
				{
					index1(i, 0) += A(i, j)*xj(j, 0);
				}
			}
			//计算x_(k+1)
			xj_1(i, 0) = (b(i,0)-index1(i,0)) / A(i, i);
		}
		//计算两个解的差值
		ej = (xj - xj_1).dot(xj - xj_1) / 6;
		//每次迭代完成,将所有xj_1的解一次性复制给xj,用于下次求解
		xj = xj_1;
		xj_1 = Vector6f::Zero();
		kj += 1;
	}
	chrono::steady_clock::time_point t4 = chrono::steady_clock::now();
	double time2 = chrono::duration_cast<chrono::duration<double>>(t4 - t3).count();
	cout << "Jacobi方法:" << endl;
	cout << "计算的结果:" << endl;
	cout << xj << endl;
	cout << "Ax:" << endl;
	cout << A * xj << endl;
	cout << "迭代的次数:" << kj << endl;
	cout << "迭代的时间" << time2<<endl;
	cout << "==============================" << endl;
	system("pause");
	return 0;
}
Gauss-Seidel迭代法和Jacobi迭代法
===================================
高斯-赛德尔迭代法
计算的结果为:
0.993268
  1.9927
0.993837
 1.99436
 0.99536
  1.9973
Ax=
-0.0139883
   4.98833
  -2.00901
   4.99498
  -2.00292
         6
迭代的次数为:8
迭代的时间为:0.0005605
====================================
Jacobi方法:
计算的结果:
0.988895
 1.99242
0.984831
 1.99242
0.984831
 1.99445
Ax:
-0.0292492
    5.0111
  -2.03996
    5.0111
  -2.03996
   6.00813
迭代的次数:13
迭代的时间0.0007516
==============================
请按任意键继续. . .

5.3 实现SOR迭代法

#include<iostream>
#include<Eigen/Core>
#include<Eigen/Dense>
#include<chrono>

using namespace std;

typedef Eigen::Matrix<float, 6, 6> Matrix6f;
typedef Eigen::Matrix<float, 6, 1>Vector6f;
const double er = 0.0001;

int main(int argc, char** argv)
{
	//生成数据
	Matrix6f A;
	A << 4, -1, 0, -1, 0, 0,
		-1, 4, -1, 0, -1, 0,
		0, -1, 4, -1, 0, -1,
		-1, 0, -1, 4, -1, 0,
		0, -1, 0, -1, 4, -1,
		0, 0, -1, 0, -1, 4;
	Vector6f b;
	b << 0, 5, -2, 5, -2, 6;

	//定义误差
	double e = 1;
	//定义omega
	float omega;
	cout << "请输入w的值:";
	cin >> omega;
	
	//定义迭代初始值
	Vector6f xk = Vector6f::Zero();
	Vector6f xk_11;
	Vector6f xk_1 = Vector6f::Zero();
	//定义中间计算量
	Vector6f index = Vector6f::Zero();
	//定义迭代次数
	int k = 0;

	//SOR迭代
	chrono::steady_clock::time_point t1 = chrono::steady_clock::now();
	while (e > er)
	{
		e = 0;
		for (int i = 0; i < A.cols(); i++)
		{
			//保存迭代计算之前的值
			xk_11(i, 0) = xk(i, 0);
			index(i, 0) = 0;
			for (int j = 0; j < A.cols(); j++)
			{
				if (j != i)
				{
					index(i, 0) += A(i, j)*xk(j, 0);
				}
			}
			//计算x_{k+1}
			xk(i, 0) = (b(i, 0) - index(i, 0)) / A(i, i);
			//计算xk_1,每轮迭代完成的值都保存在vk_1向量中
			xk_1(i, 0) = (1 - omega)*xk_11(i, 0) + omega * xk(i, 0);
		}
		//更新每次迭代完成的信息
		//计算误差,前后的值分别保存在xk_11和xk_1中
		e = (xk_1 - xk_11).dot(xk_1 - xk_11) / 6;
		xk = xk_1;
		k += 1;
	}
	chrono::steady_clock::time_point t2 = chrono::steady_clock::now();
	double time = chrono::duration_cast<chrono::duration<double>>(t2 - t1).count();
	cout << "SOR迭代" << endl;
	cout << "解:" << endl;
	cout << xk;
	cout << "b" << endl;
	cout << A * xk << endl;
	cout << "迭代的次数:" << k << endl;
	cout << "迭代的时间:" << time << "秒" << endl;
	
	system("pause");
	return 0;
}
请输入w的值:1.2
SOR迭代
解:
0.996406
 1.99735
0.997802
 1.99783
0.998151
 1.99901b
-0.00956082
    4.99705
   -2.00298
    4.99897
   -2.00159
    6.00008
迭代的次数:7
迭代的时间:0.0004327秒
请按任意键继续. . .
请输入w的值:0.6
SOR迭代
解:
0.981769
 1.98007
0.983152
 1.98458
0.987272
  1.9926b
-0.0375741
   4.96807
  -2.02464
   4.98614
  -2.00816
   5.99996
迭代的次数:13
迭代的时间:0.0007727秒
请按任意键继续. . .
  • 1
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值