远程服务器:
1、4块 RTX 3090
2、系统:ubuntu18.04
下面简要记录一下安装步骤:
安装miniconda
1、从miniconda官网下载对应系统的.sh文件;
2、然后在.sh文件所在目录下,运行./Miniconda3-latest-Linux-x86_64.sh
;
这一步可能会出现权限问题,加入sudo,使用sudo ./Miniconda3-latest-Linux-x86_64.sh
即可解决,这样miniconda就安装好了。
创建pytorch的虚拟环境
1、使用命令conda create --name pytorch_gpu python=3.6
创建python 3.6,pytorch的gpu版本的虚拟环境;
这一步可能会出现权限限制问题:
使用sudo chown 1000:1000 /home/ubuntu/.conda
即可解决这个权限限制的问题;
2、修改上面的权限之后,使用同样的命令conda create --name pytorch_gpu python=3.6
即可创建虚拟环境,使用命令conda activate pytorch_gpu
即可激活名为pytorch_gpu的虚拟环境。
3、进入虚拟环境之后,输入python,然后import torch,看是不是会报错,如果不报错,则说明pytorch安装成功;
创建TensorFlow的虚拟环境
在这之前写过一篇详细的安装过程无需源码编译 | 基于RTX3090配置tensorflow1.15环境,可以参考进行安装,这里只是粗略记录一下安装过程;
这些依赖包的下载地址:依赖包下载地址(提取密码5tgm)这个地址是参考博文【1】的哦,直接下载,然后在依赖包的路径下,按照下面的顺序pip install ×××
即可。
测试Pytorch和TensorFlow的虚拟环境是否安装成功
1、在命令行输出python
;
2、import torch
,如果没有报错,则说明安装成功;如果报错说没有这个模块,则需要再安装一下;
3、import tensorflow as tf
,如果没有报错,则说明安装成功;如果报错说没有这个模块,则需要将依赖包卸载再安装一下;
PS: 我第一次安装在root路径下安装,安装失败,第二次进入home路径安装,安装成功。暂时不知道这两个路径是否对安装有影响,因为第一次安装的时候,我还有一个2.4.0版本的tensorflow,可能是这个原因导致我第一次安装失败的。第二次安装的时候,我卸载2.4.0版本的tensorflow,卸载之前安装的所有依赖包,同时更换到home路径下,最后安装成功。
参考
【1】:RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置