GeForce GTX 1080 Ti服务器搭建GPU加速环境

GeForce GTX 1080 Ti + NVIDIA 驱动470.239 + CUDA11.3 + python3.10 + pytorch1.10.0 + torchvision0.12.0 +kornia0.6.8 环境搭建

一、起因

搞毕设要运行代码来训练模型,但报错:
The NVIDIA driver on your system is too old (found version 11000).Please update your GPU driver by downloading and installing a new version from the URL

就是说显卡驱动太低,和pytorch版本不适配。

输入nvidia-smi查看显卡信息,发现服务器的显卡驱动最高只能支持到CUDA11.0;
输入nvcc -V查看cuda的版本为9.1;

但我的pytorch是2.2,需要CUDA11.8以上的版本,所以现在由两个选择:①升级显卡驱动和CUDA版本;②降低pytorch版本。

我首先尝试第二种方法(因为不敢随便动服务器的驱动程序,怕给服务器搞坏)

  • 尝试先下载torch0.4.0(和CUDA9.1适配),之后下载其他的依赖库,但是后来下载kornia的时候自动将torch0.4.0卸载,安装了torch2.2。(大概是因为kornia和torch也需要适配,但貌似没有kornia能和torch0.4.0适配。。。)
  • 所以现在只能尝试第一种方法。

二、升级显卡驱动程序并安装对应的CUDA、pytorch

驱动程序与CUDA的对应关系
pytorch和torchvision以及cuda对应表

  1. 升级驱动
  2. 安装CUDA
    • 查看有没有安装CUDA
    • 卸载已有的CUDA
    • 下载并安装目标CUDA
    • 修改环境变量
  3. 安装对应的pytorch
    根据上面的对应关系安装指定版本的pytorch
    pip install pytorch==1.10.0
    换源加速
    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytorch=1.10.0
    

三、其中的一些问题和小tips

  1. pip install 太慢可以使用pip install -i 镜像源 package的方式下载
    清华镜像源
  2. 安装驱动时报错
    An NVIDIA kernel module ‘nvidia-drm‘ appears to already be load
    解决
  3. nvidia-smi报错
    Failed to initialize NVML: Driver/library version mismatch
    本质原因是NVIDIA内核驱动版本与系统内核版本不一致
    解决方案
    按照上面的解决方案,我查看系统驱动发现它没有自动更新,所以我干脆按照这个链接重新将驱动又安装了一遍。

至此,按照以上流程成功搭建GPU加速环境,代码也跑通了。(有种看着孩子长大的感觉,看到代码不报错心情真的很激动!)

  • 11
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值