Code环境配置流程

win10环境配置

1、CUDA

卸载

打开程序与应用,卸载所有带有版本号的cuda插件与sdk,还有cuda visual studio integration,打开电脑管家后单项清理卸载残留的注册表。
好像可以多CUDA版本并存,没有试过 ,可参考另外其他博客。

安装

1、查看cuda版本后在https://developer.nvidia.com/cuda-toolkit-archive官网上下载合适的cuda版本,不要高于本机所支持的cuda版本,已有经验为RTX3090(支持11.1)+CUDA10.2的安装经验。
2、安装时解压路径+安装路径均可选择默认,一般为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\,自定义安装时不要勾选visual studio integration,由于这个加载需要安装visual studio,如果电脑上没有的话,会提示安装失败。
3、测试windows是否安装成功CUDA,运行nvcc -V查看
4、若没有安装成功,则需要手动配置CUDA的环境变量。将以下路径手动配置在环境变量中。

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\CUPTI\libx64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp;

CUDNN的安装

1、下载对应cude版本的cudnn
2、解压后将bin、include、lib文件夹复制到v11.1文件夹下
3、手动添加环境变量。(上面第4个步骤)
Windows查看CUDA编号

device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
print("GPU 编号: {}".format(device))

查看CUDNN版本号

print(torch.backends.cudnn.version()) #查看cudnn版本号

2、Anaconda +VScode

Anacond安装
傻瓜安装后添加环境路径:

D:\anaconda
D:\anaconda\Scripts\
D:\anaconda\Library\bin
D:\anaconda\Library\mingw-w64\bin

VScode安装
傻瓜安装后在应用商店下载

python
Chinese
Remote ssh

Bug1---------------------------- cmd中出现You may need to close and restart your shell after running 'conda init
conda create -n yangyr python=3.6建立虚拟环境,建立好之后需要conda activate env,若出现IMPORTANT: You may need to close and restart your shell after running 'conda init'.错误,意味着需要先source一下base环境,运行source activate,若出现source不是批处理命令,则直接activate env即可解决。
Bug2---------------------------- VScode中出现conda init
管理员身份运行windows PowerShell,输入conda init后报错,继而输入set-ExecutionPolicy RemoteSigned --> Y后重启VScode

Bug3---------------------------- VScode突然不能debug,只能在终端运行
解决方法1:有时候vscode不支持py3.6以下版本,新建3.6以上的虚拟环境就好(未尝试过)
解决方法2:由于python和pyplace插件版本不匹配,而导致不能debug,更换这两个插件至较低相同版本。(亲测,有用!)
Bug4---------------------------- 提示Run the following command to install 'ipykernel' into the Python environment.
解决方法:还是不匹配的问题,升级或者重启有用!执行pip install ipykernel --upgrade

3、pytorch

nvcc -V 查看电脑cuda版本
pytorch官网上的previous pytorch看cuda版本对应的torch版本
在清华源官网上https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/下载对应版本的torch。
在官网上https://download.pytorch.org/whl/torch_stable.html下载对应版本的cu***/torch-1.8.0-cp36-cp36m-win_amd64.whl文件。

pip install torch-1.2.0-cp37-cp37m-win_amd64.whl

再执行pytorch官网上的提示,下载torchvision和其他。

conda install pytorch torchvision==0.4.0 cudatoolkit=10.0

检查是否安装成功:

import torch
print(torch.cuda.is_available()) # 查看CUDA是否可用
print(torch.version.cuda) # 查看CUDA的版本号

Bug1----------- 安装torch成功后(torch.cuda.is_available()==True)发现torch.version.cuda与nvcc -V输出的cuda版本号不一致
解决方法1:由于系统中存在多个cuda版本,可卸载不用的那个(未尝试)
解决方法2:重建虚拟环境,重新安装所需cuda对应的pytorch版本(此时,采用pytorch官网上的给出安装方式,不能采用pip install .whl文件的方式)

4、tensorflow

1、新建虚拟环境 conda create -n tensorflow python==3.8
2、安装tensorflow对应版本查看(cuda 11.1对应tensorflow版本2.5.0)

pip install -U tensorflow-gpu==2.5.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

3、tensorflow与kares对应版本查看(tensorflow2.5.0对应kares)

pip install keras==2.5.0rc0

4、查看tensorflow版本是否可用

import tensorflow as tf
tf.test.is_gpu_available()

Linux环境配置

1、CUDA

1、使用命令查看ubantu版本

uname -a

输出

Linux user-X299-UD4-Pro 5.15.0-52-generic #58~20.04.1-Ubuntu SMP Thu Oct 13 13:09:46 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux

2、使用命令查看支持的最高CUDA版本

nvidia-smi

安装CUDA

1、 查看cuda版本后在官网上下载合适的cuda版本,不要高于本机所支持的cuda版本

在这里插入图片描述

2、新建文件夹CUDA,cd CUDA 之后,运行wget,然后执行sudo sh
3、Continue–accept–不要安装驱动–等待安装
4、修改~/.bashrc文件,添加环境变量

vim ~/.bashrc

按Insert键入

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
export PATH=$PATH:/usr/local/cuda-11.1/bin
# export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.3
export CUDA_HOME=/usr/local/cuda-11.1

按Esc退出后,在命令行键入:wq保存退出
激活~/.bashrc文件

source ~/.bashrc

5、nvcc -V查看是否安装成功
注:Linux可以实现多个cuda版本共存,只需要再次安装后更换~/.bashrc中的cuda版本就ok。

2、CUDNN安装

1、先在官网复制对应cuda版本的cudnn压缩包链接
2、下载cudnn安装包(老老实实下载下来再上传服务器,不然会报错)

wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.1.0.77/11.2_20210127/cudnn-11.2-linux-x64-v8.1.0.77.tgz

3、解压

tar -xvf cudnn-11.2-linux-x64-v8.1.0.77.tgz

4、解压后,复制cudnn中的文件到/usr/local/cuda中

sudo cp cuda/include/cudnn.h    /usr/local/cuda-xx.x/include # 填写对应的版本的cuda路径
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-xx.x/lib64   # 填写对应的版本的cuda路径
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h   /usr/local/cuda-xx.xx/lib64/libcudnn*

5、验证是否安装成功

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

若显示无该文件则未安装cudnn。

3、Aanconda安装

1、先在官网上复制Linux版本的安装包链接
2、运行

sh Anaconda3-2022.05-Linux-x86_64.sh

3、yes – q – 回车-- yes
4、conda -V
5、如果最后一步添加Patn路径未成功,则手动修改~/.bashrc文件,添加环境变量

export PATH=$PATH:/home/yangyr/anaconda3/bin

4、Pytorch和Tensorflow安装

pytorch 直接在官网找到合适的cuda版本,然后运行

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge

查看pytorch是否可用

import torch
torch.cuda.is_available()

Tensorflow参见win下的安装教程
安装tensorflow对应版本查看(cuda 11.1对应tensorflow版本2.5.0)

pip install -U tensorflow-gpu==2.5.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

查看tensorflow版本是否可用

import tensorflow as tf
tf.test.is_gpu_available()

Bug解决

1、sudo: pip: command not found报错

pip --trusted-host pypi.python.org install package
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值