驱动、cuda和安装pytorch GPU方法

有梦想的鱼

已于 2024-08-10 13:22:51 修改

阅读量462

点赞数 5

文章标签： pytorch 人工智能 python

于 2024-08-03 15:44:14 首次发布

本文链接：https://blog.csdn.net/qq_38148600/article/details/140891036

版权

参考全网最详细的安装pytorch GPU方法，一次安装成功！！包括安装失败后的处理方法！-CSDN博客

整体来看，一共下面三个安装步骤：

显卡驱动（nvidia-smi）-》显卡深度学习驱动（cuda）-》代码驱动（torch-gpu）

1.驱动（可跳过）

驱动安装教程：技术教程——Ubuntu下NVIDIA显卡驱动安装+卸载教程_哔哩哔哩_bilibili

安装命令：

一般买来的电脑都已经安装好了显卡驱动，或者去英伟达官网（Linux x64 (AMD64/EM64T) Display Driver | 550.90.07 | Linux 64-bit | NVIDIA）下载合适版本的驱动。我之前写了linux的安装教程（ubuntu安装显卡驱动-CSDN博客）。

首先在cmd命令窗口中输入nvidia-smi，查看驱动匹配的cuda版本，我的版本（RTX4060）为12.2。

2.安装cuda

安装cuda前一定要安装gcc，要不然会报错，错误如下：

Linux中的gcc是什么？_linux gcc是什么-CSDN博客

安装gcc

参考

查询gcc是否存在

gcc --version

Linux怎么安装gcc - CSDN文库

sudo apt update

sudo apt install build-essential

在其他Linux发行版上可以使用相应的包管理器来安装GCC，例如，在基于Fedora的系统上，可以使用 dnf 命令来安装:

sudo dnf install gcc

查看是否安装成功

gcc --version

安装cuda（linux版本）

cuda有点像是显卡驱动的补丁，有了cuda，才能使用torch-gpu等代码包。cuda版本应该小于等于驱动推荐版本（这里是12.2），并且最好不要差距太远，下面我下载安装12.1。

查询cuda版本代码：

nvidia-smi

cuda官网： https://developer.nvidia.com/cuda-toolkit-archive

uname -m

查看架构代码

wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run

sudo sh cuda_12.1.1_530.30.02_linux.run

Linux 安装 CUDA 及更新 CUDA | Adventures in Kedreamix' Digital World

sudo sh cuda_12.1.1_530.30.02_linux.run

第一步点continue

然后出现下面界面

应该先摁一下空格取消 Driver 安装（没安装驱动的不要取消），再选择 Install 安装：

下面是两个错误（可跳过）：

--------------------------------------------------------------------------------------------------------------------------

错误1：误触第一个Driver，出现下面选项，选择done，返回。

错误2：直接选择Install，没有取消 Driver 安装。

这条消息表示安装过程失败了，并且提供了日志文件的路径，你可以通过查看这个日志文件来获取安装失败的具体原因。具体来说：

“Installation failed”：这表明你尝试安装的软件（在这个例子中很可能是NVIDIA CUDA安装器）没有成功完成安装过程。
“see log at /var/log/cuda-installer.log for details”：为了了解安装失败的原因，你需要查看位于 /var/log/cuda-installer.log 的日志文件。这个日志文件记录了安装过程中的所有步骤和可能出现的错误信息。

查看报错文件

sudo cat /var/log/cuda-installer.log

--------------------------------------------------------------------------------------------------------------------------

继续安装

重新安装，使用空格关掉驱动安装，这次安装成功。

记住上面安装路径

sudo apt install vim

将上面路径加入注册表

vim ~/.bashrc

这里需要用vim编辑注册表，具体的，需要在最底部插入下面代码（记得根据上面要你记住的路径修改下面代码）。

export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64$LD_LIBRARY_PATH
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-12.1

{02.vim的工作模式_哔哩哔哩_bilibili}

保存并退出的代码为（注意：手动输入，不能复制粘贴。）

:wq

刷新修改的注册表

source ~/.bashrc

检查是否成功

nvcc -V

安装成功

安装cuda（window版本）

下面是window版本的安装

安装精简版

下面代码检查安装是否成功

nvcc  -V

3.安装torch-CUDA

注意：请在创建python虚拟环境后，激活对应虚拟环境，再安装torch-CUDA。

官网链接链接: PyTorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

这是官方的安装代码，但是一般情况下，无法安装成功。

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple

这是清华的镜像方法，不巧的是，最新的包可能没有更新上去。

那么只能去清华镜像官网下载

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/

选好版本合适的torch torchvision torchaudio ，注意版本号应该匹配安装的cuda版本。

安装的时候注意，不是使用pip安装，而是用conda。

conda install --offline pytorch-2.1.1-py3.9_cuda12.1_cudnn8.9.2_0.tar.bz2

conda install --offline torchaudio-2.1.1-py39_cu121.tar.bz2

conda install --offline torchvision-0.16.0-py39_cu121.tar.bz2

考虑到可能安装失败，这里是三件套安装失败的卸载代码：

pip uninstall torchaudio torch torchvision

下面是检查是否安装成功的代码。

import torch


print(torch.__version__)
if torch.cuda.is_available():
    print("CUDA is available.")
    device = torch.device("cuda")
    x = torch.randn(5, 5).to(device)
    print(x)
else:
    print("CUDA is not available.")
    device = torch.device("cpu")
    x = torch.randn(5, 5)
    print(x)

你有很大可能安装到cpu版本，参考下面问题分析

conda安装GPU版pytorch，结果却是cpu版本[找到问题根源，从容解决]_为什么conda安装pytorch版本不对-CSDN博客