显卡、CUDA、TensorFlow、PyTorch这四个组件想要能够稳定的运行在一个电脑上有点不容易,由于其多样性的版本经常出现各种问题,下面讨论下如何让四个组件协调工作,只考虑Windows系统下。
显卡
显卡是个人计算机最基本组成部分之一,用途是将计算机系统所需要的显示信息进行转换驱动显示器。显示芯片是显卡的主要处理单元,因此又称为图形处理器(Graphic Processing Unit,GPU),GPU是NVIDIA公司首先提出的。
这四个组件最重要的是显卡,因为是硬件是要花钱的,总不能随便就换吧,其它三个都是软件,又不要钱。
默认安装了NVIDIA显卡,需要检查你的显卡支持哪个版本的CUDA,打开电脑控制面板
这是你的电脑能够支持的CUDA版本,我的显卡是RTX2070,能够支持CUDA10.1,这是向下兼容的,当然CUDA9也是支持的
显卡驱动
显卡驱动需要与CUDA版本对应,英伟达官方给出了对应关系,详细可以查询 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
显卡驱动同样可以去控制面板中查询
如果显卡驱动不满足,可以手动下载安装 https://www.nvidia.cn/Download/index.aspx?lang=cn
CUDA
CUDA下载的官网https://developer.nvidia.com/cuda-toolkit-archive,选择适合你电脑系统的版本下载安装
注意有的版本会在下面提供补丁,也需要下载,不然运行程序偶尔会报错,例如CUDA9.0提供了四个补丁,我当时就没安装,导致运行一个程序一直报错
cuDNN
cuDNN是一个CUDA的一个加速配件,可以去https://developer.nvidia.com/rdp/cudnn-archive 下载(需要注册)
cuDNN版本和CUDA版本也有对应关系,如下图所示。需要注意的是一个CUDA版本会对应很多cuDNN版本
TensorFlow
TensorFlow和CUDA版本对应关系如下,这图是我从别人那里拿的,需要注意的是最右边的cuDNN不是固定的,上面解释过了。 如果TensorFlow版本不足,而CUDA版本过高,是不能正常运行的。
当然这是别人总结的,官方也提供了对应关系 https://www.tensorflow.org/install/source_windows
这两个图都不全,建议合在一起看
PyTorch
PyTorch版本去这个网站查询https://download.pytorch.org/whl/torch_stable.html
cu100表示CUDA10.0版本,cu101表示CUDA10.1版本
1.0.1和1.2.0表示具体的PyTorch版本
CP36表示python3.6版本,cp27表示python2.7版本
win_amd64表示Windows系统
补充torchvison和pytorch的版本关系如下:
可以在这里查看最新的https://github.com/pytorch/vision
总结
图中连线表示需要版本协调