安装cuda10.1-cudnn-pytorch
Windows平台
-
安装vs2015-update3(已安装了vs2013或更高版本直接安装即可)
-
cuda 10.1,自定义安装–>自选目录,完成安装,vs插件集成
-
环境变量设置
验证安装成功:cmd输入
nvcc -V
nvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2019 NVIDIA CorporationBuilt on Sun_Jul_28_19:12:52_Pacific_Daylight_Time_2019Cuda compilation tools, release 10.1, V10.1.243
再检查:CUDA_PATH\extras\demo_suite\deviceQuery.exe
出现以下画面为GPU调用正常
出现以下则不正常,确认驱动版本:
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL
-
与cuda10.1匹配的cuDNN
解压后的目录对应放入cuda中,bin->CUDA_BIN,include->CUDA_include,lib->CUDA_lib
-
安装anaconda
-
git: Git-2.21.0-64-bit
-
在Anaconda Prompt中运行,结果pytorch下载过于缓慢,直接抽取其中的url下载链接下载,然后本地安装
conda install --use-local D:\Anaconda3\pkgs\pytorch-1.3.1-py3.6_cuda101_cudnn7_0.tar.bz2
还需要安装其他的组件:
conda install torchvision cudatoolkit=10.1
验证安装:
from __future__ import print_function
import torch
x = torch.rand(5, 3)
print(x)
> tensor([[0.3380, 0.3845, 0.3217], [0.8337, 0.9050, 0.2650], [0.2979, 0.7141, 0.9069], [0.1449, 0.1132, 0.1375], [0.4675, 0.3947, 0.1426]])
验证cuda:(tensorflow的验证下翻)
import torch
torch.cuda.is_available()
> True
- opencv等
conda install -c conda-forge opencv
import cv2 # 无报错->成功
Tensorflow1.14与cuda10.0匹配
cuda10.0的安装相同,可以和10.1共存,只是CUDA_PATH不一样
安装10.0和10.1两个版本,安装时tf时,先修改CUDA_PATH为10.0的地址
keras:
conda activate tf1.14
conda install tensorflow-gpu=1.14.0
# 这里python3.7环境conda中没有源
pip install keras==2.1.3
python
import keras
import tensorflow
print(keras.__version__)
print(tensorflow.__version__)
Tips:
如果遇到failed call to cuInit
,检查cudnn和cuda的匹配版本
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())