我的笔记本是家庭版的win10,因为家庭版本的没有 远程登陆 功能,于是我自己从微软官网下载旗舰版程序,加上淘宝上的激活码换成了旗舰版的。现在想安装一个适合的cuda来加快深度学习的训练。
一、首先安装 C程序
c语言 是很多加速器的依赖包,所以提前安装C是个不错的选择。我的电脑是2019年买的,相比较本机的烧入代码,安装 VS2015的话有点旧了 会引起硬件问题,所以我安装的是VS2017 社区版。
- 配置方便,我只选择了C++开发,本来想加上桌面C开发,看了看需要13个G的内存,于是只选择了必要的C++开发。
- 以前的用pytorch的时候,发现大佬们将文件安装在自己创建的install文件夹下,于是我保留了这个习惯,结果在安装cuda的时候,自动安装程序找不到需要的C++库,悲哀。所以,谨记:安装VS2017时,一定不能修改默认的安装目录。
二、CUDA的安装
为了能够安装现在流行的大多数代码的依赖包,我们需安装比较新的CUDA版本,考虑到我的机子也不是很新了,我选择了 cudnn-11.0版本。
- 版本问题
首先,查看我们机子现在的nvidia状态,如下图所示。合适的cudn版本 cuda_11.0.3_451.82_win10.exe,从官网上下载时速度很快,可以直接下载。
- 安装步骤
选择自定义安装,它默认全部安装,我都是直接按默认就好。
最后,将cudnn文件解压,然后 copy------>paste(下面图来源于网络) - 设置
最后接着,在系统变量下面的“path”添加:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64 - 检验
检验的代码有2种代码方式 和一种 桌面显示方式,如下图所示。
三、安装python 相关包
虽然现在python3的版本已经有了3.7、3.8了,但是3.6版本是一个经典的版本,3.6版本支持的依赖包最多,所以我在安装Aconda的时候选择了内置为3.6的Aconda版本 Anaconda3-5.2.0-Windows-x86_64.exe。以后,遇到需要3.7、3.8的场景时,可以依靠创建 Aconda 环境来安装对应的依赖包。
四、其他
- tensorflow-gpu对cuda的支持
我去tensorflow的官网看,发现了对应的版本问题,记得会更新哦。
- 两个开源框架的支持
我心里在意的有两个。一个bert的开源框架,一个是pytorch-bert的开源框架,经查看他们都是在1.x的tf上使用的。 - pytorch的支持
我查了pytorch的官网。在它的历史版本中可以支持cuda10.0,而且cuda10.0对应的pytorch版本跟上面的两个开源框架完全适用。
最近我要安装hugging,我发现它支持的pytorch是1.3+的。我到pytorch的官网看了一下,发现:1.3+对应的版本都是10.1及以上的版本。 - rasa开源框架的安装
这个比较悲剧,因为我发现rasa自带的是tf2.1版本。
总结:只能采用的方式是,安装一个比较新的cuda版本,然后在各个不同的python环境中,它们会各自安装自己的cuda的backup.