驱动、cuda和安装pytorch GPU方法

参考全网最详细的安装pytorch GPU方法,一次安装成功!!包括安装失败后的处理方法!-CSDN博客

整体来看,一共下面三个安装步骤:

显卡驱动(nvidia-smi)-》显卡深度学习驱动(cuda)-》代码驱动(torch-gpu)

1.驱动(可跳过)

驱动安装教程:技术教程——Ubuntu下NVIDIA显卡驱动安装+卸载教程_哔哩哔哩_bilibili

安装命令:

一般买来的电脑都已经安装好了显卡驱动,或者去英伟达官网(Linux x64 (AMD64/EM64T) Display Driver | 550.90.07 | Linux 64-bit | NVIDIA)下载合适版本的驱动。我之前写了linux的安装教程(ubuntu安装显卡驱动-CSDN博客)。

首先在cmd命令窗口中输入nvidia-smi,查看驱动匹配的cuda版本,我的版本(RTX4060)为12.2。

2.安装cuda

安装cuda前一定要安装gcc,要不然会报错,错误如下:

Linux中的gcc是什么?_linux gcc是什么-CSDN博客

安装gcc

参考

查询gcc是否存在

gcc --version

Linux怎么安装gcc - CSDN文库

sudo apt update
sudo apt install build-essential

在其他Linux发行版上可以使用相应的包管理器来安装GCC,例如,在基于Fedora的系统上,可以使用 dnf 命令来安装:

sudo dnf install gcc

查看是否安装成功

gcc --version

安装cuda(linux版本)

 cuda有点像是显卡驱动的补丁,有了cuda,才能使用torch-gpu等代码包。cuda版本应该小于等于驱动推荐版本(这里是12.2),并且最好不要差距太远,下面我下载安装12.1。

查询cuda版本代码:

nvidia-smi

​ cuda官网: https://developer.nvidia.com/cuda-toolkit-archive  ​

uname -m

查看架构代码

wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
sudo sh cuda_12.1.1_530.30.02_linux.run

Linux 安装 CUDA 及 更新 CUDA | Adventures in Kedreamix' Digital World

sudo sh cuda_12.1.1_530.30.02_linux.run

第一步点continue

然后出现下面界面

应该先摁一下空格取消 Driver 安装(没安装驱动的不要取消),再选择 Install 安装:

下面是两个错误(可跳过):

--------------------------------------------------------------------------------------------------------------------------

错误1:误触第一个Driver,出现下面选项,选择done,返回。

错误2:直接选择Install,没有取消 Driver 安装。

这条消息表示安装过程失败了,并且提供了日志文件的路径,你可以通过查看这个日志文件来获取安装失败的具体原因。具体来说:

  • “Installation failed”:这表明你尝试安装的软件(在这个例子中很可能是NVIDIA CUDA安装器)没有成功完成安装过程。
  • “see log at /var/log/cuda-installer.log for details”:为了了解安装失败的原因,你需要查看位于 /var/log/cuda-installer.log 的日志文件。这个日志文件记录了安装过程中的所有步骤和可能出现的错误信息。

查看报错文件

sudo cat /var/log/cuda-installer.log

--------------------------------------------------------------------------------------------------------------------------

继续安装

重新安装,使用空格关掉驱动安装,这次安装成功。

记住上面安装路径

sudo apt install vim

将上面路径加入注册表

vim ~/.bashrc

这里需要用vim编辑注册表,具体的,需要在最底部插入下面代码(记得根据上面要你记住的路径修改下面代码)。

export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64$LD_LIBRARY_PATH
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-12.1

{02.vim的工作模式_哔哩哔哩_bilibili}

保存并退出的代码为(注意:手动输入,不能复制粘贴。)

:wq

刷新修改的注册表

source ~/.bashrc

检查是否成功

nvcc -V 

安装成功

安装cuda(window版本)

下面是window版本的安装

安装精简版

下面代码检查安装是否成功

nvcc  -V

3.安装torch-CUDA

注意:请在创建python虚拟环境后,激活对应虚拟环境,再安装torch-CUDA。

官网链接 链接: PyTorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

这是官方的安装代码,但是一般情况下,无法安装成功。

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple

这是清华的镜像方法,不巧的是,最新的包可能没有更新上去。

那么只能去清华镜像官网下载

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/

选好版本合适的torch torchvision torchaudio ,注意版本号应该匹配安装的cuda版本。

安装的时候注意,不是使用pip安装,而是用conda。

conda install --offline pytorch-2.1.1-py3.9_cuda12.1_cudnn8.9.2_0.tar.bz2
conda install --offline torchaudio-2.1.1-py39_cu121.tar.bz2
conda install --offline torchvision-0.16.0-py39_cu121.tar.bz2

考虑到可能安装失败,这里是三件套安装失败的卸载代码:

pip uninstall torchaudio torch torchvision

下面是检查是否安装成功的代码。

import torch


print(torch.__version__)
if torch.cuda.is_available():
    print("CUDA is available.")
    device = torch.device("cuda")
    x = torch.randn(5, 5).to(device)
    print(x)
else:
    print("CUDA is not available.")
    device = torch.device("cpu")
    x = torch.randn(5, 5)
    print(x)

你有很大可能安装到cpu版本,参考下面问题分析

conda安装GPU版pytorch,结果却是cpu版本[找到问题根源,从容解决]_为什么conda安装pytorch版本不对-CSDN博客

4.总结

只要是系统自动选择的工具包,安装就会出现版本不匹配的情况。

例如下面代码

只要用了类似于上面的代码,就算是第一天安装的包,直接给第二天的空白电脑安装也会出现部分工具包环境不匹配问题。

重点是,具体问题需要具体分析,不要想着一蹴而就。

上面是连续安装了四遍环境的总结。反复认证总结出来的经验。制作不易,希望点一个赞。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值