1,PYTORCH对应它的GPU,tensorflo对应它的GPU,还是可以共用GPU
各自对应各自的GPU
2,多个CUDA和cuDNN可以在一个电脑上共存吗?
可以,查看如下链接:
windows下同一个显卡配置多个CUDA工具包以及它们之间的切换_MIss-Y的博客-CSDN博客_cuda 工具包
3,虚拟环境中可以使用GPU吗?如何使用
在开始配置GPU环境开始之前,确保安装好了Anaconda,pycharm
Anaconda安装教程,网址如下
Anaconda | Individual Editionhttps://www.anaconda.com/products/individual注意:
其他步骤直接点击下一步。
pycharm安装教程,自行查阅一个
(1)torch-GPU可以采取不安装CUDA和CUDNN,直接在anaconda上实现
- 在安装好的anaconda上打开Anaconda prompt 创建虚拟环境
conda create -n pytorch python=3.6
- 创建后激活 环境
activate pytorch
到pytorch官网https://pytorch.org/
- 根据安装的环境、python和CUDA版本查看指令
输入指令,比如:
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
- 安装完成后,输入下属指令进行测试,结果为true,则表示成功
import torch
torch.cuda.is_available()
(2)tesorflow-gpu安装
此处需要先安装Visual Studio,网址为:
Visual Studio: 面向软件开发人员和 Teams 的 IDE 和代码编辑器 (microsoft.com)https://visualstudio.microsoft.com/zh-hans/注意到这一步的时候需要选择如下图所示选项:
(1)安装CUDA
检查电脑允许安装的版本,在cmd下输入命令:
nvidia-smi
- 找到对应CUDA版本号,进入官网下载
CUDA Toolkit Archive | NVIDIA Developerhttps://developer.nvidia.com/cuda-toolkit-archive
- 随后安装,注意在第三步中不选择第三选项
cmd下输入命令:
nvcc -V
如果已经安装会出现详细信息
(2)下载cudnn,网址如下:
NVIDIA cuDNN | NVIDIA Developerhttps://developer.nvidia.com/cudnn
将下载的压缩包解压,得到
打开类似于C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2的路径的文件夹
将解压文件中的bin文件夹中的文件复制到cuda对应的文件夹中
进入extras文件夹中点击如下文件夹中的deviceQuery和bandwidthTest文件,如果正常执行没有报错,则证明安装成功
随后打开 在安装好的anaconda上打开Anaconda prompt 创建虚拟环境
conda create -n tensorflow-gpu python=3.6
激活虚拟环境
activate tensorflow-gpu
下载tensorflow
conda install tensorflow-gpu==2.7.0
检测是否可以使用
开启python,执行下列代码,返回结果为true,表示在anaconda的虚拟环境中,成功。
import tensorflow as tf
tf.test.is_gpu_available()
(3)打开pycharm,在项目运行时,选择合适的虚拟环境即可
查看GPU使用情况:
windows10下
nvidia-smi
查看GPU占用率
补充:如果遇到类似缺少.dll文件的错误,可参考如下链接,重点查看自己环境变量
Anaconda虚拟环境下的PyCharm使用Tensorflow调用GPU出现dll文件缺失的问题和解决办法
PyCharm DLL load failed的原因和对治方法 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/72615307
参考文章
Anaconda环境配置
pycharm中使用anaconda部署python环境
遇到的麻烦:
1,在下载tensorflow-gpu的时候报错
error: could not find a version that satisfies the requirement tensorflow-gpu==2.7.0 (from versions: none)
error: no matching distribution found for tensorflow-gpu==2.7.0
解决方法:
使用命令
python -v
检查python是不是64版本,如果不是需要重新安装python选择64版本