本人技术小白,目前已经安装好Ubuntu 20.04,nvidia驱动版本470.86
安装cuda
CUDA Toolkit 11.5 Downloads | NVIDIA Developer
登录nvidia官方网站下载最新版本cuda 11.5
这里本人用的是离线安装的方法:
cd Downloads/ #默认下载到了Downloads文件路径下
sudo ./cuda_11.5.0_495.29.05_linux.run #安装cuda
安装完成后,验证安装是否成功。
cd /usr/local/cuda-11.5/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
输出以下信息,搞定!!!
其实以上教程百度有很多,安装cuda也简单。折腾了哥们儿好几天的难题就在下面这一堆里了。
安装lammps
度娘lammps官网,各位自行下载吧,我这里现在死活连不上官网了。(顺便吐槽一下公司的垃圾网速)
我这里下载到的文件名
tar -xvf lammps-stable.tar.gz
cd lammps-29Sep2021/lib/gpu
sudo vim Makefi.linux
修改内容
CUDA_HOME = /usr/local/cuda-11.5
CUDA_ARCH = -arch=sm_86 #这里要根据显卡核心架构修改对应参数,对照片在下图。
#这里也要感谢另外一篇文章,最初是跟着大佬的教程来操作的。
#https://blog.csdn.net/qyb19970829/article/details/105463480
计算精度直接用了默认参数。
修改完成后,保存退出。
sudo make -f Makefile.linux -j 128
这里报错了,
nvcc -I/usr/local/cuda-11.5/include -DUNIX -O3 --use_fast_math -DLAMMPS_SMALLBIG -Xcompiler -fPIC -arch=sm_86 -D_SINGLE_DOUBLE --fatbin -DNV_KERNEL -o .//dipole_long_lj.cubin .//lal_dipole_long_lj.cu
make: nvcc: Command not found
make: *** [Nvidia.makefile:58: dipole_long_lj_cubin.h] Error 127
折腾人的来了,
sudo vim Makefi.linux
修改
NVCC = nvcc
为
NVCC = /usr/local/cuda-11.5/bin/nvcc
再次编译,瞬间完成。-j 128果然够快。
cd lammps-29Sep2021/src/
make yes-gpu
sudo make mpi -j 128
编译完成。
找lammps自带的例子跑一下试试去。
cd lammps-29Sep2021/examples/DIFFUSE/
mpirun -np 4 lmp_mpi -sf gpu -pk gpu 1 -in in.msd.2d
继续报错了,吐血。错误如下
[proxy:0:0@caslx-MZ72-HB0-00] HYDU_create_process (utils/launch/launch.c:74): execvp error on file lmp_mpi (No such file or directory)
[proxy:0:0@caslx-MZ72-HB0-00] HYDU_create_process (utils/launch/launch.c:74): execvp error on file lmp_mpi (No such file or directory)
[proxy:0:0@caslx-MZ72-HB0-00] HYDU_create_process (utils/launch/launch.c:74): execvp error on file lmp_mpi (No such file or directory)
[proxy:0:0@caslx-MZ72-HB0-00] HYDU_create_process (utils/launch/launch.c:74): execvp error on file lmp_mpi (No such file or directory)
2021 11 26
烂尾了,另开一篇:
Ubuntu 20.04+NVIDIA驱动+Cuda11.5+FTTW3.3.10+lammps GPU加速_qq_564515064的博客-CSDN博客