服务器离线搭建深度学习环境
目录
前言
工作中常常遇到离线安装环境依赖的问题,在深度学习训练模型的服务器上离线搭建环境依赖,还是第一次,记录下整个过程以防忘记。
CUDA下载与安装
cuda的历史版本: CUDA Toolkit Archive | NVIDIA Developer
安装方法参考:Ubuntu18.04离线安装pytorch_gpu版本教程_离线安装gpu驱动_閤廴聿的博客-CSDN博客
离线安装需要下载 runfile 的版本,安装方式如下:
sudo sh cuda_10.1.243_418.87.00_linux.run
安装完了设置环境变量,注意将cuda更换为你自己的版本
export PATH=/usr/local/cuda-11.3/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.3
然后记得souce一下
source ~/.bashrc
输入以下指令验证是否安装成功
nvcc --version
安装成功的相关提示如下:
CUDNN下载与安装
下载地址:cuDNN Archive | NVIDIA Developer
安装方法参考:Ubuntu cudnn安装_ubuntu安装cudnn_竹子2021的博客-CSDN博客
首先解压缩
// 朋友们注意自己下载文件的名称
tar -xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz
将部分文件复制到对应版本的cuda相关位置中
// 朋友们注意自己下载文件的名称
sudo cp cuda/include/cudnn.h /usr/local/cuda-11.1/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.1/lib64/
sudo chmod a+r /usr/local/cuda-11.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.1/lib64/libcudnn*
注意一下:cudnn8.0以上会将版本信息更新到cudnn_version.h文件中,也需要将这个文件复制,否则验证的时候会没有反应
// 朋友们注意自己下载文件的名称
sudo cp cuda/include/cudnn_version.h /usr/local/cuda/include/
输入以下内容验证是否安装成功
// 朋友们注意自己下载文件的名称
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
安装成功输出信息如下,前三行末尾的数字组合起来就是你安装的cudnn的版本名
离线安装Anaconda
安装方法:
Ubuntu18.04 安装 Anaconda3_ubuntu安装anaconda_梦dancing的博客-CSDN博客
bash Anaconda3-5.2.0-Linux-x86_64.sh
卸载方法:
python版本问题
在离线的情况下想要创建特定版本的python有点困难,最简单的方式就是直接下载对应Python版本的Anaconda
下载地址如下:
部分Anaconda版本与python版本的对应关系如下。
Anaconda3-2020.07-Linux-x86_64.sh python3.8.3
Anaconda3-2020.11-Linux-x86_64.sh python3.8.5
Anaconda3-2021.04-Linux-x86_64.sh python3.8.8
Anaconda3-2021.11-Linux-x86_64.sh python3.9.7
离线创建conda虚拟环境
由于没有网,常用的方法无法使用
通过复制base环境,再更换相关依赖的方式来解决。
相关指令如下:
conda create --clone base -n my_env
Pytorch安装
首先下载版本对应的pytorch、torchaudio、torchvision, 下载地址如下:
Index of /anaconda/cloud/pytorch/linux-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
torch安装
安装方法:
conda install --use-local pytorch-1.3.0-py3.7_cuda10.0.130_cudnn7.6.3_0.tar
查看安装的torch版本及可用的cuda、cudnn
import torch
torch.cuda.is_available() # 检查cuda是否可用
torch.version.cuda # 查看cuda版本
torch.backends.cudnn.is_available() # 检查cudnn是否可用
torch.backends.cudnn.version() # 查看cudnn版本
torchaudio、torchvision安装
安装方法与torch一样
结语
至此在服务器上搭建的主要环境就基本完成了,其他的python库就通过下载whl文件再利用pip安装吧