tensorflow和pytorch框架的安装以及cuda踩坑记录

pytorch

采用conda创建虚拟环境python=3.6以后,我发现使用conda install torchvision安装完pytorch是cpu版本的,不支持gpu,在跑代码时报错了。

import torch
torch.__version__
torch.cuda.is_available()

此时cuda是False,gpu不可用。然后需要用conda uninstall torchvision卸载torchvision。
再使用pip install torchvision -i https://pypi.douban.com/simple安装,验证gpu是否可用,此时是True,gpu可用。

以上亲测,pip安装的torchvision会同时安装对应cuda toolkit包,而conda安装只支持cpu。

tensorflow

在我折腾半天显卡驱动、cuda、cudnn以后,发现使用conda安装tensorflow,会自动安装对应的cuda,验证gpu是否可用,竟然是True。。。

import tensorflow as tf
tf.test.is_gpu_available()

亲测:
不装cuda和cudnn,直接采用conda创建虚拟环境以后,使用conda install tensorflow-gpu==1.15.0会自动安装对应cuda toolkit包,然后验证gpu是否可用,是True。

关于cuda和cudnn

1、显卡驱动可以在ubuntu的Software & Updates中的additional drivers中进行更换。
在这里插入图片描述
2、nvidia-smi显示的是驱动cuda版本为11.2。与手动安装的cuda toolkit包不同。
在这里插入图片描述
查看cuda版本
手动安装会在usr/local文件夹下。

cat /usr/local/cuda/version.txt

没有安装cuda输入nvcc -V命令,会出现安装cuda的sudo apt-get install命令,使用这个命令安装的cuda不在local文件夹下,而在usr/lib文件夹下。输入上面的命令会显示没有该目录。手动进入lib文件夹下,也有version.txt可看到版本。不建议用此方式。

查看cudnn版本
1)使用tar.gz安装的cudnn

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

2)使用deb安装的cudnn

dpkg -l | grep cudnn

在这里插入图片描述

3、关于3者的版本问题。
在这里插入图片描述

驱动cuda版本向下兼容cuda toolkit版本。通俗的解释就是,nvidia-smi显示的驱动cuda是11.2,最高支持cuda11.2。这里tensorflow1.15.0对应的cuda为10.0,cudnn为7.4.2。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值