Windows10+RTX显卡:TensorFlow-GPU安装与使用完整指南(踩坑无数血泪教训)

(update 2021.7.1)
几次重装之后遇到新问题,因为要升级到2.3版本了,所以在环境配置上又走了不少坑,这里分享一下:
1、anaconda装在C盘,path选项勾选
2、在prompt中使用conda install来安装tensorflow-gpu而不要用pip
3、2.3版本对应cuda其实也不需要很新,我这里用的是cuda_10.1.105_418.96
5.安装完后大概率出现找不到cudnnx.x等dll找不到的问题,解决方案:安装cudnn7.6.5,我的情况是不记得什么时候安装包目录下就有一个cudnn-10.0-windows10-x64-v7.6.5.32的压缩包,直接解压,对应文件夹复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1下面就可以成功启用GPU了

(update 2021.12.31)
对面计院新到了一台电脑10900K+3090,我同学讲不会配置tf-gpu环境,于是新一轮的折腾又开始了
1.对于这种新机器 完全可以安装最新的anaconda,还是要装在C盘,path选项勾选
2.可以使用pip来安装tf-gpu
3.装好上面两个之后安装最新版NV驱动,再安装最新版CUDA,然后需要在系统环境变量中加入下面几条(好像安装cuda之后就自己添加了第一条了)。
在这里插入图片描述

重启 此时jupyter应该可以正常的调用GPU了,但如果出现没调用成功,jpt的控制台显示Could not load library cudnn_cnn_infer64_8.dll. Error code 126。那么需要去官网下载上一个版本的cuDNN 并替换C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.5对应文件,至于为啥我也不懂 这里是引自另一位博主的方法
https://blog.csdn.net/qq_41112170/article/details/121878288
https://blog.csdn.net/qq_41112170/article/details/121878288
然后就可以正常的调用并训练模型了


配置环境
根据需要在https://repo.anaconda.com/archive/
anaconda对应py版本表https://blog.csdn.net/yuejisuo1948/article/details/81043823
下载对应版本的conda,主要是py版本和tf-gpu的对应
#------------------主流tfgpu所对应的anaconda,py,toolkit版本
2.2:Anaconda - 2020,Python - 3.7.7,cudatoolkit - 10.1,cudnn - 7.6.5
1.14.0或1.15:Anaconda3 - 5.2.0,Python - 3.6,cudatoolkit - 10.0.130,cudnn - 7.6.5

conda源(在C盘用户文件夹.condarc 用记事本打开):
注意:实践发现有时候装完conda之后不会创建这个文件,这时候在conda prompt运行
conda config --set show_channel_urls yes
conda config --set ssl_verify false
来创建文件再编辑

channels:
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  - defaults
show_channel_urls: true

defaults的话安装各种包更齐全,更新,但是需要有很快的机场,没有的同学还是删掉把(滑稽

管理员运行Anaconda Prompt

conda install tensorflow-gpu==2.1
conda install tensorflow-gpu==1.14.0
另附实用conda search+你要装的包比如上面的tensorflow
conda search tensorflow
会显示所有你可以安装的tf版本

在NV官网下载CUDA
(在前面安装tfgpu时会附带安装toolkit,但是仅限于基本的功能,比如在新版本的TF(2.6)中调用keras就出现了提示找不到keras的情况)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

测试是否能正常调用

import tensorflow as tf
import numpy as np
import pandas as pd
from tensorflow.python.client import device_lib
%matplotlib inline 
#comment out line above if you are not using Jupyter
import matplotlib.pyplot as plt
import os
print(device_lib.list_local_devices())
gpu_ok = tf.config.list_physical_devices(device_type="GPU")
print("\nAre we using GPU? -",tf.test.is_gpu_available())


#指定CPU执行
#with tf.device('/cpu:0'):
#显示实际是哪个设备在执行训练
#tf.Session(config=tf.ConfigProto(log_device_placement=True))
#多个程序同时使用GPU,fraction是百分比值,根据显卡情况自行设定。比如作者就玩个枫之谷,可以让它占用80%,但是这个是TF1的代码,TF2不再认了,我还没去找TF2调整这个部分的代码,有需要的同学自行百度
#gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.8)  
#sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options,log_device_placement=True))
#启用TensorCore(有RTX的同学有福了)
os.environ['TF_ENABLE_AUTO_MIXED_PRECISION'] = '1'

要发挥gpu的最大性能,请将每轮训练的batch尽可能地调到最大,最大,最大…
否则按照教程使用CPU的batch量,你会发现GPU训练比CPU还慢…

Jupyter指定路径
把快捷方式里的%USERPROFILE% 换成你的目录 不用加任何符号

环境安全
安装好了的环境就不要去更改任何一个组件的版本了,组件互相依赖,
比如作者升级了一个spyder它就会顺带升级很多东西,然后整个环境就坏掉了,Jupyter什么的全部启动闪退,只能推倒重来 /掩面哭

虚拟环境和在虚拟环境使用jpy

conda create --name *yours*
conda actiave *yours*
conda jupyter notebook

END
开始你的训练之旅把!

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要在RTX 305上安装TensorFlow GPU,您需要执行以下步骤: 1. 安装CUDA Toolkit:访问NVIDIA官方网站,下载并安装与您的操作系统和型号兼容的CUDA Toolkit。 2. 安装cuDNN:访问NVIDIA官方网站,下载并安装与您的CUDA版本兼容的cuDNN。 3. 安装TensorFlow GPU:使用pip命令安装TensorFlow GPU。例如,输入以下命令:pip install tensorflow-gpu 4. 验证安装:启动Python解释器,导入TensorFlow并运行一些TensorFlow代码,以确保TensorFlow GPU已正确安装并可以正常工作。 请注意,安装TensorFlow GPU需要一些计算机知识和技能。如果您不确定如何执行上述步骤,请寻求专业人士的帮助。 ### 回答2: RTX3050是一款性能出色的,可以用于深度学习任务。而tensorflow-gpu则是一种广泛使用的深度学习框架,可以提高计算速度和效率。在安装tensorflow-gpu的过程中,需要注意以下几点。 第一,确保驱动程序已正确安装RTX3050需要安装最新的驱动程序,以确保其正常运行并提供最佳性能。可以从官方网站或厂商网站下载并安装驱动程序。 第二,安装CUDA。CUDA是一种用于GPU加速的计算平台,可大大提高计算速度。可以从 NVIDIA 的官方网站上下载和安装适用于 RTX3050 的最新 CUDA 版本。 第三,安装cuDNN。cuDNN是一种用于加速深度神经网络训练的库。可以从 NVIDIA 的官方网站上下载适用于RTX3050的最新版本。 第四,下载和安装TensorFlow-GPU。在安装tensorflow-gpu之前,需要确保安装了适用于RTX3050 GPU的CUDA和cuDNN。可以使用包管理器,如pip,进行安装。首先要确保pip已经安装。然后可以使用pip install tensorflow-gpu 命令来安装tensorflow-gpu。 第五,检查安装是否成功。可以在Python中导入tensorflow-gpu并运行简单的深度学习代码,以确认安装是否成功。如果能正常运行,说明tensorflow-gpu已经成功安装。 总之,安装tensorflow-gpu需要正确安装相应的驱动程序、CUDA和cuDNN,并使用包管理器pip进行安装。成功安装后,可以使用导入tensorflow-gpu并运行简单示例来检查。 ### 回答3: RTX 3050是一款新款,其GPU运算速度非常快,可用于机器学习和深度学习等高性能计算领域。 在安装TensorFlow-GPU时,首先需要确保已经成功安装了CUDA和cuDNN。使用RTX 3050,可以选择CUDA 11.1版本和cuDNN 8.0版本。需要注意的是,安装支持RTX 3050的CUDA和cuDNN版本是至关重要的。 接下来,用户需要下载TensorFlow-GPU的whl文件。TensorFlow官网提供了不同的whl文件,可以根据用户的操作系统选择下载。如果使用Windows操作系统,则需要下载TensorFlow-GPU whl文件,文件名中包含了CUDA和cuDNN版本号信息,这是为了保证TensorFlow和CUDA及cuDNN的版本相匹配。 在下载完whl文件后,用户可以通过pip install命令进行安装,具体的命令为:pip install tensorflow-GPU-[version]-cp[python版本]-cp[python版本]m-win_amd64.whl,其中version是TensorFlow版本号,[python版本]是当前系统上所使用的Python版本号。 如果在安装过程中遇到问题,可以通过查看TensorFlow官方文档或论坛上其他开发者发布的解决方案来解决问题。此外,也可以通过与其他开发者的交流或咨询专业技术人员来解决问题。 总的来说,安装TensorFlow-GPU需要注意CUDA和cuDNN版本号的选择,以及TensorFlow版本和Python版本的匹配。只要按照正确的步骤操作,就能成功安装TensorFlow-GPU并开始进行高性能计算和深度学习应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值