Eigen优化及并行性能测试

近期开展方程组求解过程中,发现求解速度随着节点数量的增加快速降低,还没有确定出具体原因在哪,于是就先对使用的Eigen库进行了研究,Eigen是一个开源的矩阵计算库,使用C++语言,大量应用模板,同时有BLAS、MKL、LAPACKE等高性能库的接口。

测试源程序如下:
#include
#include “Eigen/Dense”
#include <time.h>
#include <stdio.h>

using namespace Eigen;
using namespace std;
 
int main(int argc,char *argv[])
{
  //Eigen::initParallel();
  int dim;
  if(argc>1)
  {
    dim = atoi(argv[1]);
  }
  else{
    dim = 10;
  }
  MatrixXd A = MatrixXd::Random(dim,dim);
  MatrixXd B = MatrixXd::Random(dim,dim);
  //cout << "A =" << endl << A << endl;
  VectorXd b = VectorXd::Random(dim);
  //cout << "b =" << endl << b << endl;
  VectorXd x(dim);
  time_t begin_t  = clock();
  x = A.colPivHouseholderQr().solve(b);  
  //cout << "The solution is:\n" << x << endl;
  //A= A*B;
  time_t finish_t = clock();
  cout<<"it cost " << (double )(finish_t - begin_t )/CLOCKS_PER_SEC <<" s"<<endl;
  return 0;
}

直接编译:

g++ test_eigen.cpp

运行[1000*1000]后

./a.out 1000

计算时间为19.0214 s

编译器优化编译后:

g++ -Ofast test_eigen.cpp

计算时间为0.628668 s

增加-mavx -mfma参数后

g++ -Ofast -mavx -mfma test_eigen.cpp

计算时间为0.554892 s,略有提升。

后期采用自动化测试工具进行测试,对不同的矩阵大小和优化参数的效果进行测试。

上述Ofast可能会有一些不安全的问题,具体进一步参考https://www.zhihu.com/question/27090458/answer/137944410

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Eigen库可以通过使用OpenMP或CUDA来实现并行求解线性方程组。以下是使用OpenMP并行求解线性方程组的示例代码: ```c++ #include <Eigen/Dense> #include <omp.h> int main() { Eigen::MatrixXd A(1000, 1000); Eigen::VectorXd b(1000); Eigen::VectorXd x(1000); // Initialize A and b #pragma omp parallel for for (int i = 0; i < 1000; i++) { x(i) = 0.0; } Eigen::SparseLU<Eigen::SparseMatrix<double>> solver; solver.analyzePattern(A); solver.factorize(A); x = solver.solve(b); return 0; } ``` 在上面的代码中,我们使用了OpenMP来并行初始化向量x。接下来,我们使用Eigen的SparseLU求解器来求解线性方程组。在调用`solve`函数之前,我们必须先调用`solver.analyzePattern`和`solver.factorize`函数。最后,我们可以使用`solver.solve`函数来求解线性方程组。 要使用CUDA来并行求解线性方程组,我们需要使用Eigen的CUDA模块。以下是使用CUDA并行求解线性方程组的示例代码: ```c++ #include <Eigen/Dense> #include <Eigen/CUDA> int main() { Eigen::MatrixXd A(1000, 1000); Eigen::VectorXd b(1000); Eigen::VectorXd x(1000); // Initialize A and b x.setZero(); Eigen::CUDASparseLU<Eigen::SparseMatrix<double>> solver; solver.analyzePattern(A); solver.factorize(A); x = solver.solve(b); return 0; } ``` 在上面的代码中,我们使用了Eigen的CUDA模块来进行并行计算。与使用OpenMP不同,我们不需要显式地并行初始化向量x,因为CUDA模块会自动并行计算。我们还使用了Eigen的CUDASparseLU求解器来求解线性方程组。在调用`solver.solve`函数之前,我们必须先调用`solver.analyzePattern`和`solver.factorize`函数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值