环境安装血泪史之人工智能劝退篇(anaconda3+cuda10.2+cudnn7.6+tensorflow-gpu2.1.0)win10系统的gpu版

由于疫情的影响,无法去学校,所以安装tensorflow-gpu环境的时候没有导师指点,只能在网上找教程,因为安装的是最新的情况所以踩到了许多前人没踩过的坑
接下来我将分六步来讲解
建议每一步都找专门的教程看看,如果你的anaconda,cuda,cudnn,tf都安装下来了,建议把我的第四步和第六步的测试看一下。
我安装了两次,第一次是因为cuda版本问题,第二次是因为cuda的lib里缺少一个文件(该文件只有cuda的10.1版中有)
但如果你是安装tensorflow的cpu版本的话,要相对简单很多,只用安装anaconda就好了,cuda和cudnn是gpu版需要安装的,所以如果安装cpu版最好还是找其他教程来看。
(gpu的运行算力要强于cpu,如果是学习人工智能要求运算效率最好选择gpu)

一:Anaconda

这一步应该是最简单的了
https://www.anaconda.com/
这是官网
在这里插入图片描述点击DOWNLOAD now。在这里插入图片描述
然后根据电脑类型进行选择,64位选64-bit 32位选择32bit

安装时可以一直点next,但是到了这一步,如图在这里插入图片描述
这时候要在两个框都点钩,这时候就等待安装完成了(这一步是将其添加进环境变量,如果不把第一个框的勾打上那么安装完成后就需要手动添加)
在这里插入图片描述
然后就会出现如图的六个标

还不放心的话,可以看看csdn其他大佬的anaconda教程,csdn已经有大佬出过相关安装教程
https://blog.csdn.net/oZuoYu123/article/details/104646652?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158771598219726869065418%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=158771598219726869065418&biz_id=0&utm_source=distribute.pc_search_result.none-task-blog-2allbaidu_landing_v2~default-2

二:cuda10.2

首先要确认你的显卡类型版本是否与cuda10.2合适,建议上官网查,但gtx1650特殊,官网列表里没有,其实gtx1650也可以安装cuda10.2

可以直接百度搜索
https://developer.nvidia.com/cuda-downloads 这是官网。
https://developer.nvidia.com/cuda-toolkit-archive可以找到更多版本

点击相应系统的安装在这里插入图片描述(由于我没有截图,所以从其他大佬那找了张图)但是虽然版本不一样,下载界面都一样,只是cuda10.2的大小是2.6g,最好是本地下载

安装过程中可能出现的问题:在这里插入图片描述

这是由于你的显卡驱动版本可能不符合。(我第一次安装cuda8.0的时候截的图,后来改安cuda10.2就没又出现了)
接下来的安装我是一路next,但是这个地方要画勾!
打勾是添加cuda的环境变量
安装完后会出现四个图标
在这里插入图片描述
并生成一个C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
可以查看一下环境变量

三:cudnn7.6

cudnn7.6这是cuda10.2配套的深度学习网络框架加速器
可以在官网中下,这个是比较麻烦的一步因为cudnn的下载需要登陆nvidia的账号,才能下载,好在他可以通过qq或者微信来申请创建nv的账号
官网下载:https://developer.nvidia.com/rdp/cudnn-archive
这是官网。
下载完可以发现它是个压缩包,将里面的bin,include,lib三个文件夹解压到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2。
然后添加环境变量
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include

四:测试cuda

打开cmd命令行(win+r 输入cmd 按回车)
输入:nvcc -V
在这里插入图片描述
可以看到版本

五:下载tensorflow

下载tensorflow有两种选择

1.直接在anaconda的base环境下载

优点:base是anaconda下载完成后自带的主环境,因为base环境里含有许多科学第三方库,所以直接使用这个环境以后就不用再下载一些可能会用的第三方库了,例如numpy,matplotlib库,pandas库
步骤
1.打开cmd命令行
2.输入pip install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
其中https://pypi.tuna.tsinghua.edu.cn/simple是镜像源

2.创建一个新环境

该方法适用于tensorflow版本与python版本不契合的情况

1.打开cmd命令行,输入:conda create python35
等待一会,它会把配置都配好
2.激活:activate python35
3.用pip下载tensorflow包,一般从官网下载就是:pip install tensorflow-gpu==(版本号)
但是这样太慢,我们可以换成国内镜像:
pip install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
这样就快多了。
当然可能下载过程中会断很多次,但这应该是正常现象,我也失败过很多次
在这里插入图片描述
以后使用tensorflow可以直接在python35环境中使用了(activate python35)
(注:我是直接下载在anaconda的base里的,所以直接跳过了1,2步)

这是全下载完的图

六:测试tensorflow-gpu能否导入

建议以上五步都完成后可以休息一下,放松一下大脑。因为接下来的环节如果出问题
可能之前的努力就都白费了,所以放轻松。
在这里插入图片描述

好的,我们继续

情况一:直接下载的

如果是直接下载在base里的,可以直接在cmd命令行中输入python,然后再import tensorflow as tf

情况二:创建了新环境再下载的

1.打开命令行,输入:conda activate python35(这是转到之前创建的python35环境中)
**2.上一步完成后,行头会出现一个(python35)这就表示你已经进入该环境

在这里插入图片描述
然后输入:python
用import导入tensorflow包

问题一:假如无法找tensorflow

引入会出现以下提示
在这里插入图片描述
这是说明你的tensorflow包没有下载到python35的环境里,

解决方案一

这时你就需要再在python35环境里重复做一遍第五部的第3小步!下图

解决方案二(不建议)

图可以找到你的tensorflow安装的地址在哪。(最好在python35环境里下)在这里插入图片描述
然后导入tensorflow的时候,不要在python35环境中使用tensorflow。

问题二:找不到cudart64_101.dll

找不到cudart64_101.dll
在引入tensorflow时出现报错
Could not load dynamic library 'cudart64_101.dll
Ignore above cudart dlerror if you do not have a GPU set up on your machine

这是因为找不到cudart64_101.dll这个文件,
这个文件应该在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin里,但是在cuda10.2里没有

解决方案一

https://cn.dll-files.com/cudart64_101.dll.html里下载,但是太慢了,所以我下载后将其放在了网盘上
这是链接,link
提取码:6wwd
如果失效了可以联系我,我会上传新的链接

解决方案二

这个文件只有cuda10.1里有,我出现这问题时就想换下cuda10.1,但后来发现第一种方法,所以就没去尝试,不过应该也可以,tensorflow2.1.0也可以和cuda10.1配套

这些问题解决之后再输入:tf.test.is_gpu_available()
在这里插入图片描述

最后会出现true,这就表示成功了
建议再到这个anaconda navigator管理软件里(anaconda下载自带)找一下是否成功下载了tensorflow

所有都解决了
承让,承让在这里插入图片描述
看到最后给个赞呗

  • 11
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
自编译tensorflow: 1.python3.5,tensorflow1.12; 2.支持cuda10.0,cudnn7.3.1,TensorRT-5.0.2.6-cuda10.0-cudnn7.3; 3.无mkl支持; 软硬件硬件环境:Ubuntu16.04,GeForce GTX 1080 TI 配置信息: hp@dla:~/work/ts_compile/tensorflow$ ./configure WARNING: --batch mode is deprecated. Please instead explicitly shut down your Bazel server using the command "bazel shutdown". You have bazel 0.19.1 installed. Please specify the location of python. [Default is /usr/bin/python]: /usr/bin/python3 Found possible Python library paths: /usr/local/lib/python3.5/dist-packages /usr/lib/python3/dist-packages Please input the desired Python library path to use. Default is [/usr/local/lib/python3.5/dist-packages] Do you wish to build TensorFlow with XLA JIT support? [Y/n]: XLA JIT support will be enabled for TensorFlow. Do you wish to build TensorFlow with OpenCL SYCL support? [y/N]: No OpenCL SYCL support will be enabled for TensorFlow. Do you wish to build TensorFlow with ROCm support? [y/N]: No ROCm support will be enabled for TensorFlow. Do you wish to build TensorFlow with CUDA support? [y/N]: y CUDA support will be enabled for TensorFlow. Please specify the CUDA SDK version you want to use. [Leave empty to default to CUDA 10.0]: Please specify the location where CUDA 10.0 toolkit is installed. Refer to README.md for more details. [Default is /usr/local/cuda]: /usr/local/cuda-10.0 Please specify the cuDNN version you want to use. [Leave empty to default to cuDNN 7]: 7.3.1 Please specify the location where cuDNN 7 library is installed. Refer to README.md for more details. [Default is /usr/local/cuda-10.0]: Do you wish to build TensorFlow with TensorRT support? [y/N]: y TensorRT support will be enabled for TensorFlow. Please specify the location where TensorRT is installed. [Default is /usr/lib/x86_64-linux-gnu]://home/hp/bin/TensorRT-5.0.2.6-cuda10.0-cudnn7.3/targets/x86_64-linux-gnu Please specify the locally installed NCCL version you want to use. [Default is to use https://github.com/nvidia/nccl]: Please specify a list of comma-separated Cuda compute capabilities you want to build with. You can find the compute capability of your device at: https://developer.nvidia.com/cuda-gpus. Please note that each additional compute capability significantly increases your build time and binary size. [Default is: 6.1,6.1,6.1]: Do you want to use clang as CUDA compiler? [y/N]: nvcc will be used as CUDA compiler. Please specify which gcc should be used by nvcc as the host compiler. [Default is /usr/bin/gcc]: Do you wish to build TensorFlow with MPI support? [y/N]: No MPI support will be enabled for TensorFlow. Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native -Wno-sign-compare]: Would you like to interactively configure ./WORKSPACE for Android builds? [y/N]: Not configuring the WORKSPACE for Android builds. Preconfigured Bazel build configs. You can use any of the below by adding "--config=" to your build command. See .bazelrc for more details. --config=mkl # Build with MKL support. --config=monolithic # Config for mostly static monolithic build. --config=gdr # Build with GDR support. --config=verbs # Build with libverbs support. --config=ngraph # Build with Intel nGraph support. --config=dynamic_kernels # (Experimental) Build kernels into separate shared objects. Preconfigured Bazel build configs to DISABLE default on features: --config=noaws # Disable AWS S3 filesystem support. --config=nogcp # Disable GCP support. --config=nohdfs # Disable HDFS support. --config=noignite # Disable Apacha Ignite support. --config=nokafka # Disable Apache Kafka support. --config=nonccl # Disable NVIDIA NCCL support. Configuration finished 编译: bazel build --config=opt --verbose_failures //tensorflow/tools/pip_package:build_pip_package 卸载已有tensorflow: hp@dla:~/temp$ sudo pip3 uninstall tensorflow 安装自己编译的成果: hp@dla:~/temp$ sudo pip3 install tensorflow-1.12.0-cp35-cp35m-linux_x86_64.whl
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值