【Linux】Ubuntu20.04版本配置pytorch环境2023.09.05【教程】

【Linux】Ubuntu20.04版本配置pytorch环境2023.09.05【教程】

一、安装Anaconda虚拟环境管理器

首先进入Anaconda官网下载linux版本的安装文件Anaconda3-2023.07-2-Linux-x86_64.sh,进入安装文件路径,运行下面的脚本进行安装

bash Anaconda3-2023.07-2-Linux-x86_64.sh

安装需要阅读用户协议,一直按enter就行了,到当前页面时需要输出yes进行确认即可开始安装。

Image

然后按照提示进行操作即可完成安装。

二、安装Miniconda虚拟环境管理器

如果觉得,Anaconda下载太慢的话,可以使用miniconda来代替,

sudo apt update
sudo apt upgrade
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

然后和安装Anaconda类似的执行

bash ./Miniconda3-latest-Linux-x86_64.sh

然后进行安装即可

三、创建虚拟环境并激活

Anaconda基本环境管理语法如下

  • 创建虚拟环境
conda create -n <your-virtualenv-name> python=3.8
  • 激活虚拟环境
conda activate <your-virtualenv-name>
  • 取消激活虚拟环境
deactivate
  • 移除虚拟环境
conda env remove -n <your-virtualenv-name>
  • 查看所有虚拟环境
conda env list
  • 克隆现有的环境
conda create --name <new_env_name> --clone <existing_env_name>
  • 卸载虚拟环境中的某个包
conda remove --name <your-virtualenv-name> <pkg-name>
conda uninstall --name <your-virtualenv-name> <pkg-name>

安装完成之后,可以创建虚拟环境,创建虚拟环境完毕之后我们先激活该环境。比如我创建了一个虚拟环境metaRL,然后使用conda activate metaRL进行激活

Image

四、anaconda取消默认激活虚拟环境

如果不想每次启动终端的的时候都激活anaconda虚拟环境,我们可以取消默认激活,打开终端输入以下的语句即可

conda config --set auto_activate_base false

五、安装Pytorch

首先进入Pytorch官网,然后选择您设备的型号,复制相应的安装语句进行安装即可

Image

比如我这里复制的安装语句是

pip3 install torch torchvision torchaudio

然后等待安装结束

Image

经过漫长的等待

Image

终于安装结束了,出现成功安装Suceessfully built lit的提示

Image

六、测试pytorch

安装成功后我们需要测试是否能正常使用,打开终端,在终端中启动python

python

导入pytorch

import torch

查看torch版本

print(torch.__version__)

查看cuda是否可用

print(torch.cuda.is_available())

结果如下,则表示安装成功

Image

如果配置了cudacudnn可以使用以下的语句进行查看,具体如何配置请参考这篇:ubuntu配置多版本cuda+cudnn环境,及版本切换方法

torch.version.cuda
torch.backends.cudnn.version()

如下所示

Image

Reference

https://blog.51cto.com/u_16099166/6739522

ubuntu@VM-0-10-ubuntu:~$ ubuntu@VM-0-10-ubuntu:~$ lsb_release -d Description: Ubuntu 20.04 LTS ubuntu@VM-0-10-ubuntu:~$ nvidia-smi Thu Mar 20 09:50:51 2025 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 525.105.17 Driver Version: 525.105.17 CUDA Version: 12.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 Tesla T4 On | 00000000:00:08.0 Off | 0 | | N/A 35C P8 9W / 70W | 2MiB / 15360MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+ ubuntu@VM-0-10-ubuntu:~$ nvcc --version Command 'nvcc' not found, but can be installed with: sudo apt install nvidia-cuda-toolkit ubuntu@VM-0-10-ubuntu:~$ cat /usr/local/cuda/version.txt cat: /usr/local/cuda/version.txt: No such file or directory ubuntu@VM-0-10-ubuntu:~$ cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 cat: /usr/include/cudnn_version.h: No such file or directory ubuntu@VM-0-10-ubuntu:~$ python -V Python 3.8.10 ubuntu@VM-0-10-ubuntu:~$ 这是上述指令,帮助我梳理安装上述组件的步骤
最新发布
03-21
<think>好的,用户现在提供了他们执行的一系列命令和输出结果,请求帮助梳理安装组件的步骤。首先,我需要仔细分析用户当前的环境状态,然后根据已有的知识和之前的回答来制定合适的安装步骤。 用户的环境Ubuntu 20.04 LTS,已经安装了NVIDIA驱动版本525.105.17,支持CUDA 12.0,但用户在执行nvcc --version时遇到了“命令未找到”的错误,同时检查CUDA的version.txt和cudnn_version.h时也提示文件不存在。这说明用户可能只安装了NVIDIA驱动,但未正确安装CUDA Toolkit和cuDNN。此外,Python版本是3.8.10,符合用户之前提到的环境要求。 接下来,我需要确定用户的当前问题。根据用户的指令输出,主要问题在于CUDA Toolkit和cuDNN未正确安装。用户可能需要安装这些组件,以便进行深度学习或其他GPU加速的任务。此外,用户可能还想安装LibTorch,但由于之前的输出中没有相关信息,可能需要进一步确认。 接下来,我需要回顾之前的对话历史。用户之前询问了如何检查各个组件的版本,现在根据执行结果,用户需要安装缺失的组件。因此,我需要提供一步步的安装指南,涵盖CUDA Toolkit、cuDNN以及可能的LibTorch安装步骤。 考虑到用户已经安装了NVIDIA驱动,但CUDA Toolkit未安装,首先需要指导用户安装CUDA 12.0。由于用户执行nvcc未找到,可能需要通过官方方法安装CUDA Toolkit,而不仅仅是驱动。用户可能尝试使用sudo apt install nvidia-cuda-toolkit,但需要注意默认仓库中的版本可能不是12.0,因此需要从NVIDIA官网下载runfile或deb包进行安装。 然后是cuDNN的安装。用户检查cudnn_version.h文件失败,说明cuDNN未安装。需要指导用户注册NVIDIA开发者账号,下载对应CUDA 12.0的cuDNN 8.x版本,并通过dpkg或tar包安装。 另外,用户可能需要配置环境变量,确保CUDA路径正确,这在前一个回答中的常见问题部分提到过,需要在当前回答中再次强调,尤其是解决nvcc命令未找到的问题。 关于Python 3.8.10,用户可能已经安装了正确的版本,但需要确认是否安装了pip和相关库,如torch,可能需要指导用户安装PyTorch,并确认其是否支持CUDA 12.0。但根据官方文档,PyTorch可能尚未支持CUDA 12.0,可能需要调整版本,或者用户需要安装CUDA 11.x版本。但用户的环境目标是CUDA 12.0,这可能导致兼容性问题,需要特别指出。 此外,用户可能还需要安装LibTorch,但需要确认CUDA版本是否兼容。如果LibTorch不支持CUDA 12.0,可能需要降级CUDA版本,或者寻找其他解决方案。 在整理步骤时,需要结构清晰,分步说明每个组件的安装方法,包括可能的错误处理,例如环境变量配置,路径问题,版本兼容性等。同时,需要保持回答的准确性和实用性,避免用户在执行过程中遇到问题。 最后,总结用户当前的状态,指出已安装的组件和缺失的部分,并提供完整的安装步骤,确保用户能够顺利搭建所需的环境。</think>以下是针对您当前系统状态的组件安装步骤梳理,已结合您提供的输出版本信息(Ubuntu 20.04 + Driver 525 + CUDA 12.0 + cuDNN缺失 + Python 3.8): --- ### **当前环境诊断** | 组件 | 状态 | 问题原因 | |--------------|---------------------|--------------------------| | Ubuntu | ✅ 20.04 LTS | 无需操作 | | NVIDIA驱动 | ✅ 525.105.17 | 无需操作 | | CUDA Runtime | ✅ 12.0(驱动支持) | 但未安装`CUDA Toolkit` | | CUDA编译器 | ❌ `nvcc`未安装 | CUDA Toolkit未安装 | | cuDNN | ❌ 未安装 | 需手动安装 | | Python | ✅ 3.8.10 | 无需操作 | --- ### **分步安装指南** #### **1. 安装CUDA Toolkit 12.0** > *为什么需要安装?* > `nvidia-smi`显示的CUDA 12.0是驱动支持的**最高版本**,但实际开发需要`nvcc`编译器和CUDA库。 **操作步骤**: ```bash # 下载官方CUDA 12.0安装包(推荐deb方式) wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/12.0.1/local_installers/cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb # 安装CUDA Toolkit sudo apt-key add /var/cuda-repo-ubuntu2004-12-0-local/7fa2af80.pub sudo apt update sudo apt install cuda-12-0 # 添加环境变量到 ~/.bashrc echo 'export PATH=/usr/local/cuda-12.0/bin${PATH:+:${PATH}}' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc source ~/.bashrc # 验证安装 nvcc --version # 应显示CUDA 12.0 cat /usr/local/cuda/version.txt # 应输出CUDA 12.0 ``` --- #### **2. 安装cuDNN 8.x(适配CUDA 12.0)** > *注意*:需注册[NVIDIA账号](https://developer.nvidia.com/login)后下载 **操作步骤**: ```bash # 下载cuDNN 8.9.3 for CUDA 12.x(替换为实际下载链接) # 示例文件名:cudnn-linux-x86_64-8.9.3.28_cuda12-archive.tar.xz # 解压并安装 tar -xvf cudnn-linux-x86_64-8.9.3.28_cuda12-archive.tar.xz cd cudnn-linux-x86_64-8.9.3.28_cuda12-archive sudo cp include/cudnn*.h /usr/local/cuda-12.0/include/ sudo cp lib/libcudnn* /usr/local/cuda-12.0/lib64/ sudo chmod a+r /usr/local/cuda-12.0/include/cudnn*.h /usr/local/cuda-12.0/lib64/libcudnn* # 验证安装 cat /usr/local/cuda-12.0/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 ``` --- #### **3. 配置Python环境PyTorch适配CUDA 12.0)** ```bash # 安装pip(如未安装) sudo apt install python3-pip # 安装PyTorch(需确认支持CUDA 12.0) pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 # 验证CUDA可用性 python3 -c "import torch; print(f'PyTorch版本: {torch.__version__}, CUDA可用: {torch.cuda.is_available()}')" ``` --- ### **关键问题说明** 1. **CUDA版本冲突** - 若出现`libcudart.so.12: cannot open shared object file`错误,执行: ```bash sudo ldconfig /usr/local/cuda-12.0/lib64 ``` 2. **PyTorch与CUDA 12.0兼容性** - 截至2023年10月,PyTorch官方暂未提供预编译的CUDA 12.0版本,需使用`cu121`测试版或降级到CUDA 11.8。 3. **cuDNN路径验证** - 若使用非默认安装路径,需在编译项目时显式指定头文件和库路径。 --- ### **最终环境检查** ```bash nvidia-smi # 驱动 + CUDA Runtime nvcc --version # CUDA编译器 python3 -c "import torch; print(torch.__version__, torch.cuda.is_available())" # PyTorch+CUDA cat /usr/local/cuda-12.0/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 # cuDNN版本 ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

木心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值