解决3080显卡tensorflow与pytorch在cuda11.1的安装问题

最新推荐文章于 2024-08-15 19:05:31 发布

苦心人天不负

最新推荐文章于 2024-08-15 19:05:31 发布

阅读量8.1k

点赞数 11

分类专栏： nvidia

原文链接：https://blog.csdn.net/wu496963386/article/details/109583045

版权

nvidia 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、驱动及cuda、cudnn的安装

RTX3080采用了新的Ampere架构GA102-200，那么显卡驱动也必然是需要最新的，可以参考cuda与驱动对应的关系：

我安装的是455.23.04版本，CUDA是11.1版本，cudnn是8.0.4.30版本，具体的安装方法可参考一下网址。

ubuntu16.04系统run方式安装nvidia显卡驱动
 Ubuntu16.04下cuda和cudnn的卸载和升级

方法都是大同小异，最后输入nvidia-smi确认驱动是否安装好，nvcc --version确认是否安装好cuda。
驱动版本
cuda版本

二、pytorch的安装

1. 源码编译安装

pytorch的安装相对简单一些，可以选择源码编译安装，也可以选择直接pip的方式安装。由于我的网络实在不好，每次在拉源码的时候都会报错，就放弃了。。依赖库真的太难下载了。具体的源码编译方式可参考下面的方法。
RTX3080/RTX3090驱动安装CUDA11.1+CUDNN8.0.4.30+pytorch源码编译
 Pytorch源码编译简明指南

2. pip方式安装

进入pytorch官网，可以看到下载方式，命令：

pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

也可以进入下载的网站，直接点击下载，然后再通过安装whl的方式进行安装pytorch。
在这里插入图片描述
安装完的结果如下图。

安装完再进行测试，版本以及cuda是否可用。
在这里插入图片描述

三、TensorFlow的安装

※ nvidia-tensorflow==1.15.4+nv20.10版本的安装

经过大量资料的查找，得知TensorFlow官方是已经放弃了1.x的版本更新，那么还有没有还在更新的TensorFlow1.x版本呢？答案是有，终于被我们找到了，参考Accelerating TensorFlow on NVIDIA A100 GPUs。这是nvdia官方对也是安培架构的A100 GPU进行编译的TensorFlow 1.15版本，进行了简单介绍以及安装方法，这对同样是安培架构的3080也是通用的。

具体安装方法简介如下：

1. 安装 TensorFlow wheel的索引

 pip install nvidia-pyindex

大概率是会安装报错，有许多个依赖包，且有些包比较大，如果是不能科学上网的话，很难一次性安装成功。那么优先安装依赖包。

3. 安装nvidia-TensorFlow对应的依赖包

具体依赖包有下：

nvidia-cublas           11.2.1.74
nvidia-cuda-cupti       11.1.69
nvidia-cuda-nvcc        11.1.74
nvidia-cuda-nvrtc       11.1.74
nvidia-cuda-runtime     11.1.74
nvidia-cudnn            8.0.4.30
nvidia-cufft            10.3.0.74
nvidia-curand           10.2.2.74
nvidia-cusolver         11.0.0.74
nvidia-cusparse         11.2.0.275
nvidia-dali-cuda110     0.26.0
nvidia-dali-nvtf-plugin 0.26.0+nv20.10
nvidia-nccl             2.7.8
nvidia-pyindex          1.0.5
nvidia-tensorboard      1.15.0+nv20.10
nvidia-tensorrt         7.2.1.4
tensorflow-estimator    1.15.1

且依赖包的版本也需要严格对应（以上版本都是对应TensorFlow1.15.4+nv20.10的），否则会报错无法安装。最后安装nvidia-tensorflow，可以得到版本是1.15.4+nv20.10。安装结果如下图。
在这里插入图片描述