之前介绍了如何安装openmpi并识别TorquePBS排队系统(戳我),我发现openmpi还支持CUDA。所以重新安装了一遍。和之前唯一的区别在于预编译时需要指定CUDA的库函数文件(见官网说明)。所以在编译时,如下操作即可。
sudo ./configure --prefix=<MPIDIR> --with-tm=<TORQDIR> --with-cuda=<CUDADIR/include> --with-cuda-libdir=<CUDADIR/lib64> CC=gcc CXX=g++ FC=<ifort全路径>/ifort
这样就完成了openmpi识别CUDA的预编译,后面的步骤是一样的。