Ubuntu20+GTX3080的Pytorch环境搭建

item版本
python3.7
CUDA11.3
CUDNN8.2.00
Pytorch1.11

安装CUDA环境部分:1~3
安装Pytorch部分:

1、准备工具

  • make:
    sudo apt install make
  • gcc:
    sudo apt install gcc

2、禁用第三方(nouveau)驱动

  • 安装依赖:
    sudo apt-get install dkms build-essential linux-headers-generic
  • 打开conf文件:
    sudo vim /etc/modprobe.d/blacklist.conf
    在末尾添加:
    blacklist nouveau
    blacklist lbm-nouveau
    options nouveau modeset=0
    alias nouveau off
    alias lbm-nouveau off
    
  • 禁用第三方驱动:
    echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
  • 更新并重启:
    sudo update-initramfs -u
    sudo reboot

3、下载并安装NVIDIA驱动

  • 下载驱动:
    wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/470.82.00/NVIDIA-Linux-x86_64-470.82.00.run
  • 权限设置:
    sudo chmod 775 NVIDIA-Linux-x86_64-470.82.00.run
  • 移除留存的驱动:
    sudo apt-get remove nvidia* && sudo apt autoremove
    基于run文件安装的驱动卸载:sudo bash XXX.run --uninstall
  • 安装驱动:
    sudo bash NVIDIA-Linux-x86_64-470.82.00.run

4、安装CUDA、pytorch、pytorchvision

3080要求CUDA版本为11.3及以上:
(你需要先安装好Anconda或者Miniconda)
conda install pytorch torchvision cudatoolkit=11.3 -c pytorch

5、验证

验证pytorch能否使用cuda,通过torch.cuda.is_available()是不可靠的,通过torch.tensor(1).cuda()方式是可靠的,如果没有报错证明CUDA可用。

6、可能的Bug

6.1、ValueError: signal number 32 out of range

Exception in Thread: ValueError: signal number 32 out of range

6.2 经常性nvidia-smi命令失效

参考:https://blog.csdn.net/u013685264/article/details/121903540

7、卸载该Nvidia驱动

实际上和安装命令差不多,只不过多了--uninstall
sudo bash NVIDIA-Linux-x86_64-470.82.00.run --uninstall

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是一个对称矩阵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值