编译HPL (hpl-2.0_FERMI_v08.tar) 过程简记

本文记录了在CUDA环境下编译和运行高性能线性代数基准测试HPL的过程,包括安装预装组件如BLAS、LAPACK,以及解决编译过程中遇到的libhpl.a和CUDA版本不匹配等问题。通过修改Makefile和设置路径,最终成功运行mpirun -np 1 xi03。
摘要由CSDN通过智能技术生成

HPL: A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers

安装HPL for GPU (hpl-2.0_FERMI_v08.tar) 之前,机器里要预装编译器,并行环境MPI、基本线性代数子方程(BLAS)或矢量图形信号处理器(VSIPL)两者之一。

我装的是BLAS,也装了CBLAS。不记得是不是必须,我还装了一个LAPACK(Linear Algebra PACKage,http://www.netlib.org/lapack/)。

1. BLAS

    比较简单,make即可

2. CLBAS

    make文件中有个BLLIB的路径指示为../../librefblas.a,修改为BLAS的blas.LINUX.a实际位置

3. LAPCK

    make文件中指定对BLAS的位置就行了。成功后大概有个下面的结果。

                        -->   LAPACK TESTING SUMMARY  <--
                Processing LAPACK Testing output found in the TESTING direcory
SUMMARY                 nb test run     numerical error         other error
================        ===========     =================       ================
REAL                    1064911         39      (0.004%)        0       (0.000%)
DOUBLE PRECISION        1052315         203     (0.019%)        0       (0.000%)
COMPLEX                 508588          2       (0.000%)        0       (0.000%)
COMPLEX16               530862          28      (0.005%)        0       (0.000%)

--> ALL PRECISIONS      3156676         272     (0.009%)        0       (0.000%)

4.  HPL for GPU

  1.     关键改对make中这两个文件的位置改对,其他的保持默认。
        LAdir:  CBLAS 库或 VSIPL 库所在的目录
        LAlib:CBLAS 库或 VSIPL 库头文件、库文件
        编译完成后,生成可执行文件 xhpl (在hpl/<arch>/bin 目录下)。我的 <arch> 用的是默认的 CUDA_pinned
        可以借鉴 setup 目录里的各种平台下的编译文件模板,我用的是 Make.Linux_PII_CBLAS
       
       
  2.     中间有几次提示找不到 libhp
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值