系列文章目录
1.开篇——机器学习环境配置(GPU驱动下载及安装、Anaconda安装、Pycharm和Jupyter验证)(当前)
文章目录
前言
在进行机器学习前,必然绕不开对环境进行配置。在刚开始的思路,是在已经安装的python3.8上面增加必须的库,但是有些时候会用到其他版本的python怎么办呢?当时没想太多,最简单的想法是再安装一个需要的版本。这样的做法无可厚非,但是Anaconda已经为我们提供了这样一个方法,它是通过创建虚拟环境以达到不同版本的切换。但是,真正能在虚拟环境中将机器学习的训练跑起来,在知道Anaconda的作用的时候,其实还有很多事情可以做,简单总结先后顺序如下:GPU安装、GPU配套工具(cuda、cudnn)、Anaconda安装(Anaconda虚拟环境创建、虚拟环境配置、安装必要库)、在pycharm和jupyter都能确定“torch.cuda.is_available()”返回值为True。当以上全部都解决了,才算解决了跑机器学习前的环境配置。
1、GPU驱动安装及配套工具(CUDA、cudnn)
英伟达(NVIDIA)GPU驱动安装并不复杂,但是如果不是专业人员,一开始如何安装GPU驱动只能百度,但是这过程中会遇到很多坑:到哪里去下载驱动、如何提高下载速度、如何安装适合自己电脑的GPU驱动、如何确定GPU驱动的版本号。
值的注意的是,在第一次登陆英伟达(NVIDIA)的下载界面前,需要进行登陆,按照提示操作就能最终进入到下载界面。
1.1 驱动如何下载?
首先针对的GPU显卡默认是英伟达(NVIDIA)的显卡,在电脑刚买来一般是能看到硬件信息的代号。它上面进行注明,如果在买了电脑后将这块贴纸撕了,可以通过鲁大师、驱动精灵或其他渠道进行查看,但不要在鲁大师、驱动精灵上下载驱动(下载速度是龟速)。最后,我们默认你已经知道了自己电脑的型号和版本号,如我的驱动型号和版本号分别是NVIDIA GeFroce GTX 1050、472.12.
其次,当我们知道我们的驱动的型号和版本号后,我们主要是用以下两个网站来下载驱动。
网址1(点此处进入GPU版本对应的最新驱动):此处用以根据GPU型号下载驱动,但这个网站只会下载这个GPU型号的最新版本驱动,如NVIDIA GeFroce GTX 1050最新版本驱动是516.94,很明显与我的不适配。那这个网站的作用是什么呢?它的作用是查询你需要下载的驱动信号和查询下载的驱动版本能适配哪些驱动型号。当然,如果你的GPU硬件本身就是最新的,那直接就下载这个,如果是老版本的驱动下载请接着看。
网址2(点此处进入GPU型号对应的既往驱动版本):这个网址是针对老版本的GPU硬件下载驱动,一般在“Windows Driver Type”处选择“Standard”,其他按需选择。确定好信息后点击“SEARCH”,接下来就会出现适配这个型号的GPU的各种驱动版本,根据需要点击下载。
1.2 关于高速下载驱动和确定驱动对应适配的CUDA版本的问题
首先时候高速下载驱动这个问题,在上面所给的网址已经进行了修改,“www.nvidia.com”是官网,但是“www.nvidia.cn”更适合国内下载,在上面和后面所给的网站中,已经修改,点击下载的速度很快,驱动下载速度的问题解决。其次,当正确下载对应驱动并安装好以后,我们还需要知道这个版本的驱动需要对应的CUDA工具版本号,当安装完成后,我们打开NVIDIA 控制面板>帮助>系统信息>组件,如下图即可查得。这个时候,GPU的驱动下载及安装结束!
1.3GPU配套工具(cuda、cudnn)
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
CUDA和cudnn是安装pytorch前必须安装的插件,这两个东西相当于为其他方式使用GPU提供接口。
网址3(点击此处进入CUDA下载界面):这个网址是下载CUDA控件点的网址,根据查得的适配GPU驱动的CUDA版本号下载所需。除此之外,此处应记住CUDA的版本号。
网址3(点击此处进入cudnn下载界面):根据CUDA的版本号,下载对应的cudnn版本。这里在进行下载的时候,如果没有正常进入到下载界面,可看这个帖子(点击此处进入)一步步下载,如果速度慢,记得替换网址中的“.com”为“.cn”.
2、Anaconda安装(Anaconda虚拟环境创建、虚拟环境配置、安装必要库)
此处的下载安装,在百度或者CSDN中已经有了很多有些的帖子,这里我推荐几个
帖子1(最全)、帖子2(傻瓜教程)、帖子3(较详细)
说一下问题,conda命令在Anaconda中的作用跟pip在python安装的作用一样,当在Anaconda中创建好虚拟环境后,pytorch(点击此处进入Pytorch官网)在安装至虚拟空间后并没有完,需要确定Anaconda界面是否能打开,如果点击Anaconda Navigator一直没有显示界面,卡在绿色圆圈那里,可看这个帖子4(点击此处进入),这个帖子的总结最全面。
当看到这里,相信你应该将前面的问题全部解决了,但环境配置的工作还没有结束,还需要分别用pycharm和jupyter确认。
3、在pycharm和jupyter都能确定“torch.cuda.is_available()”返回值为True
在此处,因为我需要同时用到pycharm和jupyter,所以就一并进行验证。在验证前,默认已经通过Pytorch官网在Anaconda所创建的虚拟环境中安装好了python、pytorch。
首先验证pycharm,配置内核为Anaconda所创建的虚拟环境输入下面代码,并查看结果,返回Ture说明成功;再查看是否能导入tensorboard,如无问题提示,说明也成功。
import torch
import torch.utils.tensorboard
print(torch.cuda.is_available())
其次验证jupyter,在验证之前,虚拟环境已经通过pytorch自动安装了jupyter,但我们还需要进行配置其运行内核为Anaconda所创建的虚拟环境,此处参考帖子5(点击此处进入),按照顺序操作即可。然后在jupyter进行如pycharm的验证操作,但值得注意的是,有可能会出现在pycharm中能导入的包,但在jupyter却显示“No model”,这个时候最简单的方法是没有什么包就下载什么包,pip的下载加速参考帖子6(点击此处进入)。
总结
以上从GPU型号查看及适配的驱动、CUDA、cudnn如何下载进行了总结,也推荐了Anaconda安装后会遇到的问题进行总结,当按照如上方法操作,机器学习所需要的环境配置算是完成!环境配置卡了我一天的时间,写这样的文章也是方便自己以后配置其他电脑,也同时发布在CSDN上记录学习过程,也同时期望能对机器学习前期的环境配置提供一种解决套路,希望能帮到有需要的人