Code环境配置流程

小柠檬没你萌or

已于 2023-08-26 19:40:19 修改

阅读量1.6k

点赞数 2

分类专栏：装机文章标签： python pytorch 深度学习

于 2022-08-02 17:51:18 首次发布

本文链接：https://blog.csdn.net/qq_43391419/article/details/126126230

版权

装机专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Code环境配置

win10环境配置
Linux环境配置
Bug解决
- 1、sudo: pip: command not found报错

win10环境配置

1、CUDA

卸载

打开程序与应用，卸载所有带有版本号的cuda插件与sdk，还有cuda visual studio integration，打开电脑管家后单项清理卸载残留的注册表。
好像可以多CUDA版本并存，没有试过 ，可参考另外其他博客。

安装

1、查看cuda版本后在https://developer.nvidia.com/cuda-toolkit-archive官网上下载合适的cuda版本，不要高于本机所支持的cuda版本，已有经验为RTX3090（支持11.1）+CUDA10.2的安装经验。
2、安装时解压路径+安装路径均可选择默认,一般为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\，自定义安装时不要勾选visual studio integration，由于这个加载需要安装visual studio，如果电脑上没有的话，会提示安装失败。
3、测试windows是否安装成功CUDA,运行nvcc -V查看
4、若没有安装成功，则需要手动配置CUDA的环境变量。将以下路径手动配置在环境变量中。

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\CUPTI\libx64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp;

CUDNN的安装

1、下载对应cude版本的cudnn
2、解压后将bin、include、lib文件夹复制到v11.1文件夹下
3、手动添加环境变量。（上面第4个步骤）
Windows查看CUDA编号

device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
print("GPU 编号: {}".format(device))

查看CUDNN版本号

print(torch.backends.cudnn.version()) #查看cudnn版本号

2、Anaconda +VScode

Anacond安装
傻瓜安装后添加环境路径：

D:\anaconda
D:\anaconda\Scripts\
D:\anaconda\Library\bin
D:\anaconda\Library\mingw-w64\bin

VScode安装
傻瓜安装后在应用商店下载

python
Chinese
Remote ssh

Bug1---------------------------- cmd中出现You may need to close and restart your shell after running 'conda init
conda create -n yangyr python=3.6建立虚拟环境，建立好之后需要conda activate env，若出现IMPORTANT: You may need to close and restart your shell after running 'conda init'.错误，意味着需要先source一下base环境，运行source activate，若出现source不是批处理命令，则直接activate env即可解决。
Bug2---------------------------- VScode中出现conda init
管理员身份运行windows PowerShell，输入conda init后报错，继而输入set-ExecutionPolicy RemoteSigned --> Y后重启VScode

Bug3---------------------------- VScode突然不能debug，只能在终端运行
解决方法1：有时候vscode不支持py3.6以下版本，新建3.6以上的虚拟环境就好（未尝试过）
解决方法2：由于python和pyplace插件版本不匹配，而导致不能debug，更换这两个插件至较低相同版本。（亲测，有用!）
Bug4---------------------------- 提示Run the following command to install 'ipykernel' into the Python environment.
解决方法：还是不匹配的问题，升级或者重启有用！执行pip install ipykernel --upgrade

3、pytorch

nvcc -V 查看电脑cuda版本
pytorch官网上的previous pytorch看cuda版本对应的torch版本
~~在清华源官网上https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/下载对应版本的torch。~~
在官网上https://download.pytorch.org/whl/torch_stable.html下载对应版本的cu***/torch-1.8.0-cp36-cp36m-win_amd64.whl文件。

pip install torch-1.2.0-cp37-cp37m-win_amd64.whl

再执行pytorch官网上的提示，下载torchvision和其他。

conda install pytorch torchvision==0.4.0 cudatoolkit=10.0

检查是否安装成功：

import torch
print(torch.cuda.is_available()) # 查看CUDA是否可用
print(torch.version.cuda) # 查看CUDA的版本号

Bug1----------- 安装torch成功后（torch.cuda.is_available()==True）发现torch.version.cuda与nvcc -V输出的cuda版本号不一致
解决方法1：由于系统中存在多个cuda版本，可卸载不用的那个（未尝试）
解决方法2：重建虚拟环境，重新安装所需cuda对应的pytorch版本（此时，采用pytorch官网上的给出安装方式，不能采用pip install .whl文件的方式）

4、tensorflow

1、新建虚拟环境 conda create -n tensorflow python==3.8
2、安装tensorflow对应版本查看（cuda 11.1对应tensorflow版本2.5.0）

pip install -U tensorflow-gpu==2.5.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

3、tensorflow与kares对应版本查看（tensorflow2.5.0对应kares）

pip install keras==2.5.0rc0

4、查看tensorflow版本是否可用

import tensorflow as tf
tf.test.is_gpu_available()

Linux环境配置

1、CUDA

1、使用命令查看ubantu版本

uname -a

输出

Linux user-X299-UD4-Pro 5.15.0-52-generic #58~20.04.1-Ubuntu SMP Thu Oct 13 13:09:46 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux

2、使用命令查看支持的最高CUDA版本

nvidia-smi

安装CUDA

1、查看cuda版本后在官网上下载合适的cuda版本，不要高于本机所支持的cuda版本

在这里插入图片描述

2、新建文件夹CUDA,cd CUDA 之后，运行wget，然后执行sudo sh
3、Continue–accept–不要安装驱动–等待安装
4、修改~/.bashrc文件，添加环境变量

vim ~/.bashrc

按Insert键入

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
export PATH=$PATH:/usr/local/cuda-11.1/bin
# export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.3
export CUDA_HOME=/usr/local/cuda-11.1

按Esc退出后，在命令行键入:wq保存退出
激活~/.bashrc文件

source ~/.bashrc

5、nvcc -V查看是否安装成功
注：Linux可以实现多个cuda版本共存，只需要再次安装后更换~/.bashrc中的cuda版本就ok。

2、CUDNN安装

1、先在官网复制对应cuda版本的cudnn压缩包链接
2、下载cudnn安装包（老老实实下载下来再上传服务器，不然会报错）

wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.1.0.77/11.2_20210127/cudnn-11.2-linux-x64-v8.1.0.77.tgz

3、解压

tar -xvf cudnn-11.2-linux-x64-v8.1.0.77.tgz

4、解压后，复制cudnn中的文件到/usr/local/cuda中

sudo cp cuda/include/cudnn.h    /usr/local/cuda-xx.x/include # 填写对应的版本的cuda路径
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-xx.x/lib64   # 填写对应的版本的cuda路径
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h   /usr/local/cuda-xx.xx/lib64/libcudnn*

5、验证是否安装成功

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

若显示无该文件则未安装cudnn。

3、Aanconda安装

1、先在官网上复制Linux版本的安装包链接
2、运行

sh Anaconda3-2022.05-Linux-x86_64.sh

3、yes – q – 回车-- yes
4、conda -V
5、如果最后一步添加Patn路径未成功，则手动修改~/.bashrc文件，添加环境变量

export PATH=$PATH:/home/yangyr/anaconda3/bin

4、Pytorch和Tensorflow安装

pytorch 直接在官网找到合适的cuda版本，然后运行

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge

查看pytorch是否可用

import torch
torch.cuda.is_available()

Tensorflow参见win下的安装教程
安装tensorflow对应版本查看（cuda 11.1对应tensorflow版本2.5.0）

pip install -U tensorflow-gpu==2.5.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

查看tensorflow版本是否可用

import tensorflow as tf
tf.test.is_gpu_available()

Bug解决

1、sudo: pip: command not found报错

pip --trusted-host pypi.python.org install package

小柠檬没你萌or

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
Code环境配置流程

装机
复制链接

扫一扫

专栏目录