记录一下cuda和tensorflow版本对应不上踩到的坑:对齐cuda和tensorflow版本

本文档详细记录了解决CUDA版本与TensorFlow-GPU不匹配的问题。作者在新公司遇到CUDA 10.0与旧代码要求的CUDA 9.0不兼容的情况。通过修改.bashrc文件,设置环境变量,创建软链接,以及重新安装和配置相关软件,最终成功使TensorFlow-GPU1.12在CUDA 10.0环境下运行。过程中还涉及了nvidia-smi驱动的安装与更新。
摘要由CSDN通过智能技术生成

新入职一家公司,在做一个NER任务,有之前的albert NER代码,是在tensorflow-gpu1.12版本上写的,需要cuda9.0,新公司的cuda版本是10.0,对应不上

cuda的安装方法:

https://blog.csdn.net/hizengbiao/article/details/88625044

最简便的做法:

其实本来用tensorflow-gpu1.15就可以了,只要在

vim ~/.bashrc

后加入三行

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
source ~/.bashrc

使加入的三行生效

并重新设置软连接

    sudo rm -rf /usr/local/cuda   #删除之前创建的软链接
    sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
    nvcc --version    #查看当前 cuda 版本

即可。

我这里显示的9.0,因为懒得切回去了。

注意:

    此时如果nvidia-smi上显示的cuda版本与nvcc --version显示的不一致没有关系,只要高于nvcc --version即可。

当时的实际操作:

绕了好大一圈,安装cuda9.0,安装对应的cudnn,安装tensorflow-gpu 1.12,删除nvidia-smi驱动、重装,(实际上用不上)

如果出现 Driver/library version mismatch,删除驱动,再自动重装,再重启即可

sudo apt-get purge nvidia*
sudo ubuntu-drivers autoinstall
sudo reboot

这是踩坑之后最简单的方法了。

如果出现找不到 /usr/local/nvidia-smi,那就是驱动没装,直接

sudo ubuntu-drivers autoinstall

即可,这是输入nvidia-smi就正常了,再强调一遍,里面的cuda版本不用管,并不是本机实际的版本。

在cuda9.0,cudnn,tf都安装结束后,检查一下环境变量

vim ~/.bashrc

如果没有加入

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
source ~/.bashrc

再重置软连接,这也是在不同版本的cuda切换的方法

sudo rm -rf /usr/local/cuda   #删除之前创建的软链接
sudo ln -s /usr/local/cuda-9.0 /usr/local/cuda
nvcc --version    #查看当前 cuda 版本

此时的cuda版本变为了9.0,运行程序发现成功使用gpu,至此踩坑结束,绕了好大一圈。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 下面是CUDATensorFlow版本之间的对应关系: | TensorFlow版本 | CUDA支持的版本 | |----------------|---------------| | 2.5.x | 11.2 | | 2.4.x | 11.0 | | 2.3.x | 10.1 | | 2.2.x | 10.1 | | 2.1.x | 10.0 | | 2.0.x | 10.0 | | 1.15.x | 10.0 | | 1.14.x | 10.0 | | 1.13.x | 9.0 | | 1.12.x | 9.0 | | 1.11.x | 9.0 | | 1.10.x | 9.0 | | 1.9.x | 9.0 | | 1.8.x | 9.0 | 需要注意的是,除了CUDA版本外,还需要安装与所选TensorFlow版本对应的cuDNN版本。在选择TensorFlow版本之前,请先确认您的CUDA版本和系统支持的CUDA版本是否匹配。 ### 回答2: CUDATensorFlow是两个不同的软件,但它们有一些关联和依赖。CUDA是由NVIDIA开发的一种并行计算平台和编程模型,可用于利用GPU进行高性能计算。而TensorFlow则是一个由Google开发的开源机器学习框架,可以用于深度学习和其他机器学习应用。 为了让TensorFlow能够最大化地使用GPU计算能力,需要安装与CUDA相应版本兼容的TensorFlow。这是因为TensorFlow使用CUDA作为GPU的计算平台,并且需要与CUDA相应版本匹配的CUDA Toolkit和cuDNN库。如果TensorFlowCUDA版本不兼容,将导致无法运行代码或者GPU性能不佳。 查看TensorFlowCUDA版本兼容性,可以在TensorFlow官网上找到相关信息。例如,TensorFlow 2.6版本可以与CUDA 11.2和cuDNN 8.1.0配合使用。这意味着,为了在机器上成功运行TensorFlow 2.6,需要先安装CUDA 11.2和cuDNN 8.1.0。其他TensorFlow版本可能需要与其他版本CUDA和cuDNN兼容,可参考TensorFlow官网或者TensorFlow安装文档中的版本兼容性列表。 总之,为了确保良好的TensorFlow性能和可靠性,需要安装与TensorFlow版本相应的CUDA和cuDNN。在安装前,应该先了解TensorFlowCUDA版本的兼容性,以便正确选择CUDA和cuDNN的版本。 ### 回答3: CUDATensorFlow版本是密切相关的。CUDA是一种由NVIDIA开发的基于GPU的并行计算平台和编程模型,而TensorFlow则是由谷歌开发的机器学习框架,能够实现深度学习任务。 当使用TensorFlow进行深度学习训练时,需要考虑安装与操作系统和GPU兼容的版本CUDA和cuDNN软件包。这是因为TensorFlow使用GPU加速来更快地进行数学运算,而CUDA和cuDNN是实现GPU加速的必备软件包。 TensorFlow版本CUDA版本对应关系如下: TensorFlow 1.x版本: - TensorFlow 1.15支持CUDA 10.0/cuDNN 7.4.1 - TensorFlow 1.14支持CUDA 10.0/cuDNN 7.4 - TensorFlow 1.13支持CUDA 10.0/cuDNN 7.3 - TensorFlow 1.12支持CUDA 9.0/cuDNN 7.1.4 - TensorFlow 1.11支持CUDA 9.0/cuDNN 7.1.4 - TensorFlow 1.10支持CUDA 9.0 - TensorFlow 1.9支持CUDA 9.0 - TensorFlow 1.8支持CUDA 9.0 - TensorFlow 1.7支持CUDA 9.0 - TensorFlow 1.6支持CUDA 9.0 TensorFlow2.x版本: - TensorFlow 2.2支持CUDA 10.1/cuDNN 7.6 - TensorFlow 2.1支持CUDA 10.1/cuDNN 7.6 - TensorFlow 2.0支持CUDA 10.0 需要注意的是,不同版本CUDATensorFlow可能会导致不同的兼容性问题,因此确保选择兼容版本非常重要。同时,也需要确保安装的CUDA和cuDNN版本与安装的显卡类型和操作系统版本相匹配。如果不确定如何安装或选择正确的版本,请查看相关文档或咨询相关的技术支持人员。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值