参考全网最详细的安装pytorch GPU方法,一次安装成功!!包括安装失败后的处理方法!-CSDN博客
整体来看,一共下面三个安装步骤:
显卡驱动(nvidia-smi
)-》显卡深度学习驱动(cuda)-》代码驱动(torch-gpu)
1.驱动(可跳过)
驱动安装教程:技术教程——Ubuntu下NVIDIA显卡驱动安装+卸载教程_哔哩哔哩_bilibili
安装命令:
一般买来的电脑都已经安装好了显卡驱动,或者去英伟达官网(Linux x64 (AMD64/EM64T) Display Driver | 550.90.07 | Linux 64-bit | NVIDIA)下载合适版本的驱动。我之前写了linux的安装教程(ubuntu安装显卡驱动-CSDN博客)。
首先在cmd命令窗口
中输入nvidia-smi
,查看驱动匹配的cuda版本,我的版本(RTX4060)为12.2。
2.安装cuda
安装cuda前一定要安装gcc,要不然会报错,错误如下:
Linux中的gcc是什么?_linux gcc是什么-CSDN博客
安装gcc
参考
查询gcc是否存在
gcc --version
sudo apt update
sudo apt install build-essential
在其他Linux发行版上可以使用相应的包管理器来安装GCC,例如,在基于Fedora的系统上,可以使用 dnf 命令来安装:
sudo dnf install gcc
查看是否安装成功
gcc --version
安装cuda(linux版本)
cuda有点像是显卡驱动的补丁,有了cuda,才能使用torch-gpu等代码包。cuda版本应该小于等于驱动推荐版本(这里是12.2),并且最好不要差距太远,下面我下载安装12.1。
查询cuda版本代码:
nvidia-smi
cuda官网: https://developer.nvidia.com/cuda-toolkit-archive
uname -m
查看架构代码
wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
sudo sh cuda_12.1.1_530.30.02_linux.run
Linux 安装 CUDA 及 更新 CUDA | Adventures in Kedreamix' Digital World
sudo sh cuda_12.1.1_530.30.02_linux.run
第一步点continue
然后出现下面界面
应该先摁一下空格取消 Driver 安装(没安装驱动的不要取消),再选择 Install 安装:
下面是两个错误(可跳过):
--------------------------------------------------------------------------------------------------------------------------
错误1:误触第一个Driver,出现下面选项,选择done,返回。
错误2:直接选择Install,没有取消 Driver 安装。
这条消息表示安装过程失败了,并且提供了日志文件的路径,你可以通过查看这个日志文件来获取安装失败的具体原因。具体来说:
- “Installation failed”:这表明你尝试安装的软件(在这个例子中很可能是NVIDIA CUDA安装器)没有成功完成安装过程。
- “see log at /var/log/cuda-installer.log for details”:为了了解安装失败的原因,你需要查看位于
/var/log/cuda-installer.log
的日志文件。这个日志文件记录了安装过程中的所有步骤和可能出现的错误信息。
查看报错文件
sudo cat /var/log/cuda-installer.log
--------------------------------------------------------------------------------------------------------------------------
继续安装
重新安装,使用空格关掉驱动安装,这次安装成功。
记住上面安装路径
sudo apt install vim
将上面路径加入注册表
vim ~/.bashrc
这里需要用vim编辑注册表,具体的,需要在最底部插入下面代码(记得根据上面要你记住的路径修改下面代码)。
export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64$LD_LIBRARY_PATH
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-12.1
保存并退出的代码为(注意:手动输入,不能复制粘贴。)
:wq
刷新修改的注册表
source ~/.bashrc
检查是否成功
nvcc -V
安装成功
安装cuda(window版本)
下面是window版本的安装
安装精简版
下面代码检查安装是否成功
nvcc -V
3.安装torch-CUDA
注意:请在创建python虚拟环境后,激活对应虚拟环境,再安装torch-CUDA。
官网链接 链接: PyTorch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
这是官方的安装代码,但是一般情况下,无法安装成功。
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple
这是清华的镜像方法,不巧的是,最新的包可能没有更新上去。
那么只能去清华镜像官网下载
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/
选好版本合适的torch torchvision torchaudio ,注意版本号应该匹配安装的cuda版本。
安装的时候注意,不是使用pip安装,而是用conda。
conda install --offline pytorch-2.1.1-py3.9_cuda12.1_cudnn8.9.2_0.tar.bz2
conda install --offline torchaudio-2.1.1-py39_cu121.tar.bz2
conda install --offline torchvision-0.16.0-py39_cu121.tar.bz2
考虑到可能安装失败,这里是三件套安装失败的卸载代码:
pip uninstall torchaudio torch torchvision
下面是检查是否安装成功的代码。
import torch
print(torch.__version__)
if torch.cuda.is_available():
print("CUDA is available.")
device = torch.device("cuda")
x = torch.randn(5, 5).to(device)
print(x)
else:
print("CUDA is not available.")
device = torch.device("cpu")
x = torch.randn(5, 5)
print(x)
你有很大可能安装到cpu版本,参考下面问题分析
conda安装GPU版pytorch,结果却是cpu版本[找到问题根源,从容解决]_为什么conda安装pytorch版本不对-CSDN博客
4.总结
只要是系统自动选择的工具包,安装就会出现版本不匹配的情况。
例如下面代码
只要用了类似于上面的代码,就算是第一天安装的包,直接给第二天的空白电脑安装也会出现部分工具包环境不匹配问题。
重点是,具体问题需要具体分析,不要想着一蹴而就。
上面是连续安装了四遍环境的总结。反复认证总结出来的经验。制作不易,希望点一个赞。