由于疫情的影响,无法去学校,所以安装tensorflow-gpu环境的时候没有导师指点,只能在网上找教程,因为安装的是最新的情况所以踩到了许多前人没踩过的坑
接下来我将分六步来讲解
建议每一步都找专门的教程看看,如果你的anaconda,cuda,cudnn,tf都安装下来了,建议把我的第四步和第六步的测试看一下。
我安装了两次,第一次是因为cuda版本问题,第二次是因为cuda的lib里缺少一个文件(该文件只有cuda的10.1版中有)
但如果你是安装tensorflow的cpu版本的话,要相对简单很多,只用安装anaconda就好了,cuda和cudnn是gpu版需要安装的,所以如果安装cpu版最好还是找其他教程来看。
(gpu的运行算力要强于cpu,如果是学习人工智能要求运算效率最好选择gpu)
文章目录
一:Anaconda
这一步应该是最简单的了
https://www.anaconda.com/
这是官网
点击DOWNLOAD now。
然后根据电脑类型进行选择,64位选64-bit 32位选择32bit
安装时可以一直点next,但是到了这一步,如图
这时候要在两个框都点钩,这时候就等待安装完成了(这一步是将其添加进环境变量,如果不把第一个框的勾打上那么安装完成后就需要手动添加)
然后就会出现如图的六个标
还不放心的话,可以看看csdn其他大佬的anaconda教程,csdn已经有大佬出过相关安装教程
https://blog.csdn.net/oZuoYu123/article/details/104646652?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158771598219726869065418%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=158771598219726869065418&biz_id=0&utm_source=distribute.pc_search_result.none-task-blog-2allbaidu_landing_v2~default-2
二:cuda10.2
首先要确认你的显卡类型版本是否与cuda10.2合适,建议上官网查,但gtx1650特殊,官网列表里没有,其实gtx1650也可以安装cuda10.2
可以直接百度搜索
https://developer.nvidia.com/cuda-downloads 这是官网。
https://developer.nvidia.com/cuda-toolkit-archive可以找到更多版本
点击相应系统的安装(由于我没有截图,所以从其他大佬那找了张图)但是虽然版本不一样,下载界面都一样,只是cuda10.2的大小是2.6g,最好是本地下载
安装过程中可能出现的问题:
这是由于你的显卡驱动版本可能不符合。(我第一次安装cuda8.0的时候截的图,后来改安cuda10.2就没又出现了)
接下来的安装我是一路next,但是这个地方要画勾!
打勾是添加cuda的环境变量
安装完后会出现四个图标
并生成一个C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
可以查看一下环境变量
三:cudnn7.6
cudnn7.6这是cuda10.2配套的深度学习网络框架加速器
可以在官网中下,这个是比较麻烦的一步因为cudnn的下载需要登陆nvidia的账号,才能下载,好在他可以通过qq或者微信来申请创建nv的账号
官网下载:https://developer.nvidia.com/rdp/cudnn-archive
这是官网。
下载完可以发现它是个压缩包,将里面的bin,include,lib三个文件夹解压到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2。
然后添加环境变量
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include
四:测试cuda
打开cmd命令行(win+r 输入cmd 按回车)
输入:nvcc -V
可以看到版本
五:下载tensorflow
下载tensorflow有两种选择
1.直接在anaconda的base环境下载
优点:base是anaconda下载完成后自带的主环境,因为base环境里含有许多科学第三方库,所以直接使用这个环境以后就不用再下载一些可能会用的第三方库了,例如numpy,matplotlib库,pandas库
步骤
1.打开cmd命令行
2.输入pip install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
其中https://pypi.tuna.tsinghua.edu.cn/simple是镜像源
2.创建一个新环境
该方法适用于tensorflow版本与python版本不契合的情况
1.打开cmd命令行,输入:conda create python35
等待一会,它会把配置都配好
2.激活:activate python35
3.用pip下载tensorflow包,一般从官网下载就是:pip install tensorflow-gpu==(版本号)
但是这样太慢,我们可以换成国内镜像:
pip install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
这样就快多了。
当然可能下载过程中会断很多次,但这应该是正常现象,我也失败过很多次
以后使用tensorflow可以直接在python35环境中使用了(activate python35)
(注:我是直接下载在anaconda的base里的,所以直接跳过了1,2步)
这是全下载完的图
六:测试tensorflow-gpu能否导入
建议以上五步都完成后可以休息一下,放松一下大脑。因为接下来的环节如果出问题
可能之前的努力就都白费了,所以放轻松。
好的,我们继续
情况一:直接下载的
如果是直接下载在base里的,可以直接在cmd命令行中输入python,然后再import tensorflow as tf
情况二:创建了新环境再下载的
1.打开命令行,输入:conda activate python35(这是转到之前创建的python35环境中)
**2.上一步完成后,行头会出现一个(python35)这就表示你已经进入该环境
然后输入:python
用import导入tensorflow包
问题一:假如无法找tensorflow
引入会出现以下提示
这是说明你的tensorflow包没有下载到python35的环境里,
解决方案一
这时你就需要再在python35环境里重复做一遍第五部的第3小步!下图
解决方案二(不建议)
图可以找到你的tensorflow安装的地址在哪。(最好在python35环境里下)
然后导入tensorflow的时候,不要在python35环境中使用tensorflow。
问题二:找不到cudart64_101.dll
找不到cudart64_101.dll
在引入tensorflow时出现报错
Could not load dynamic library 'cudart64_101.dll
Ignore above cudart dlerror if you do not have a GPU set up on your machine
这是因为找不到cudart64_101.dll这个文件,
这个文件应该在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin里,但是在cuda10.2里没有
解决方案一
到https://cn.dll-files.com/cudart64_101.dll.html里下载,但是太慢了,所以我下载后将其放在了网盘上
这是链接,link
提取码:6wwd
如果失效了可以联系我,我会上传新的链接
解决方案二
这个文件只有cuda10.1里有,我出现这问题时就想换下cuda10.1,但后来发现第一种方法,所以就没去尝试,不过应该也可以,tensorflow2.1.0也可以和cuda10.1配套
这些问题解决之后再输入:tf.test.is_gpu_available()
最后会出现true,这就表示成功了
建议再到这个anaconda navigator管理软件里(anaconda下载自带)找一下是否成功下载了tensorflow
所有都解决了
承让,承让
看到最后给个赞呗