低算力SM_30使用最新pytorch-1.13

本文详细介绍了如何在搭载Quadro K4000(SM_30)的CentOS8系统上,配置NVIDIA驱动、CUDA 10.2、CUDNN、NCCL 2.4.8-1以及PyTorch 1.13.0a0。包括禁用nouveau、安装驱动、CUDA的安装与验证、CUDNN的安装步骤,以及编译安装PyTorch和其依赖torchvision和torchaudio的详细过程。
摘要由CSDN通过智能技术生成

SM_30,如,Quadro K4000。

Centos8.4,内核4.18.0-348.7.1.el8_5.x86_64。

(1)安装nvidia驱动

1、启动方式需要为BIOS,不是UEFI。

2、禁用nouveau并重启(安装Nvidia显卡的官方驱动和系统自带的nouveau驱动冲突)

lsmod |grep nouveau

如果有输出说明nouveau正在加载

打开禁用列表/etc/modprobe.d/blacklist-nouveau.conf

在最后一行加上

blacklist nouveau

options nouveau modset=0

然后更新重塑

>>>dracut /boot/initramfs-`(uname -r).img `(uname -r)

重启机器

reboot

查看是否禁用成功,输入

lsmod |grep nouveau

若没有输出,则表示禁用成功

3、安装基础依赖环境

yum -y install gcc kernel-devel kernel-headers

4、、安装驱动

在Nvidia官网下载相应驱动

官网下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn

NVIDIA-Linux-x86_64-470.182.03.run

下载成功后上传至Linux服务起,如/opt目录下,进入下载的驱动所在目录执行安装

chmod +x NVIDIA-Linux-x86_64-470.182.03.run

sh NVIDIA-Linux-x86_64-470.182.03.run -no-opengl-files -no-nouveau-check

安装过程中选择accept

如果提示要修改xorg.conf,选择yes

如果报此错: WARNING: You do not appear to have an NVIDIA GPU supported by the 430.34 NVIDIA Linux graph

加上:–add-this-kernel 参数

如果报此错: unable to find the kernel source tree for the currently running kernel…

加上:–kernel-source-path=/usr/src/kernels/内核号(2+Tab键 自动出现)

如果报此错:unable to load the kernel module ‘nvidia.ko’ …

执行:./NVIDIA-XXXX.run --kernel-source-path=/usr/src/kernels/内核号 -k ·(uname -r)

回车!

检查是否安装成功

nvidia-smi

Thu Apr 20 04:08:24 2023      

+-----------------------------------------------------------------------------+

| NVIDIA-SMI 470.182.03   Driver Version: 470.182.03   CUDA Version: 11.4     |

|-------------------------------+----------------------+----------------------+

| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |

| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |

|                               |                      |               MIG M. |

|===============================+======================+======================|

|   0  Quadro K4000        Off  | 00000000:13:00.0 Off |                  N/A |

| 30%   41C    P8    10W /  87W |      0MiB /  3018MiB |      0%      Default |

|                               |                      |                  N/A |

+-------------------------------+----------------------+----------------------+

                                                                              

+-----------------------------------------------------------------------------+

| Processes:                                                                  |

|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |

|        ID   ID                                                   Usage      |

|=============================================================================|

|  No running processes found                                                 |

+-----------------------------------------------------------------------------+

(2)安装CUDA

下载CUDA文件

下载地址-https://developer.nvidia.cn/cuda-toolkit-archive

比如我下载的版本是cuda_10.2.89_440.33.01_linux.run (最后一个支持SM_30的版本)

首先给cuda可执行权限:

chmod +x cuda_10.2.89_440.33.01_linux.run

运行cuda文件:

sh cuda_10.2.89_440.33.01_linux.run

安装过程的选项选择:

 会先有个阅读声明,一直按D即可,然后accept。

 选项install nvidia accelerated Graphics Driver,输入n,因为我们已经安装了nvidia的驱动。

 选项install the OpenGL libraries,如果双显卡(集显+独显)选择n,如果只有独显可以选择y,如果双显卡选择y的话,会出现黑屏或者循环登录的问题,如果加了上面的参数就不会出现这个选项了。

 后面的可以都选择yes,最后一个选项我们可以选择n,也就是不复制Samples,因为安装目录下有samples。

安装过程结束后会有以下信息:

Driver:   Not Selected

Toolkit:  Installed in /usr/local/cuda-10.2/

Samples:  Installed in /root/

代表安装完成,但是不代表成功。这时需要重启。

验证cuda是否安装成功

将cuda的bin文件和lib导出到系统环境中:

export PATH="/usr/local/cuda-10.2/bin:$PATH"

export LD_LIBRARY_PATH="/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH"

终端输入:

nvcc -V

如果有CU

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值