一、Linux配置Cuda步骤
1、conda虚拟环境安装CUDA和CUDNN(貌似安装 nvidia-tensorflow时会安装cuda、cudnn等):
深度学习环境配置——conda虚拟环境安装CUDA和CUDNN_conda虚拟环境中安装cuda-CSDN博客
2、安装tensorflow-gpu:30系显卡配置tensorflow1.x环境_30使用tensorflow1-CSDN博客
3、Nvidia下的tensorflow:pip install --user nvidia-tensorflow[horovod] 会报错
1)源码下载安装,分支(r1.15.5+nv21.11)下有通过源码安装
GitHub - NVIDIA/tensorflow: An Open Source Machine Learning Framework for Everyone
2)whl下载安装:
https://developer.download.nvidia.cn/compute/redist/nvidia-tensorflow/
二、WIN配置Cuda步骤
在配置tensorflow环境的时候很是头疼,因为3090只支持cuda11.0+的版本,而tensorflow1.×已经不再维护,没有出支持cuda11.0+的版本了。
Linux装显卡驱动需禁用 nouveau:Ubuntu内核升级导致显卡冲突,升级显卡并禁用自动更新教程_ubuntu内核与显卡驱动不兼容_zh4men9的博客-CSDN博客
Cuda文档:NVIDIA Multi-Instance GPU User Guide :: NVIDIA Data Center GPU Driver Documentation
查看GPU、Mig实例 的ID:nvidia-smi -L
nvidia-smi
mianma@mianma:~$ nvidia-smi
Sun Mar 28 14:47:33 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39 Driver Version: 460.39 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GTX 105... Off | 00000000:01:00.0 Off | N/A |
| N/A 47C P0 N/A / N/A | 313MiB / 4040MiB | 5% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1030 G /usr/lib/xorg/Xorg 80MiB |
| 0 N/A N/A 1607 G /usr/lib/xorg/Xorg 134MiB |
| 0 N/A N/A 1785 G /usr/bin/gnome-shell 35MiB |
| 0 N/A N/A 3364 G ...AAAAAAAAA= --shared-files 52MiB |
+-----------------------------------------------------------------------------+
可以看到右上方显示CUDA Version: 11.2说明该驱动支持的最高CUDA版本是11.2
- 型号、版本(RTX30xx的显卡还不支持Tensorflow1.X)
- 显卡:RTX3080 12G
- PYTHON:3.8.0
- CUDA:11.1.1
- Cudnn:8.0.5.39
- Tensorflow-1.15.4:
①Python3.8:https://github.com/fo40225/tensorflow-windows-wheel/issues/167
tensorflow-windows-wheel/1.15.4+nv20.12 at master · fo40225/tensorflow-windows-wheel · GitHub 下载对应的GPU压缩包并解压,将解压后的whl文件直接用pip安装即可。
②Python3.7:Cuda版本应该要更改为以下的
知乎:win10,RTX 3070,可以安装cuda10.0和tensorflow-gpu1.14.0吗? - 知乎
链接:百度网盘 请输入提取码
提取码:dg4q
- 安装Cuda、Cudnn:
1.1 显卡驱动:https://www.nvidia.cn/Download/index.aspx?lang=cn
①安装(自定义):
展开Driver components,查看“Driver”的版本,如果当前版本大于Cuda所需版本,则不勾选该“Driver”,反之亦然。
2、(需登录)下载对应的Cudnn:cuDNN Archive | NVIDIA Developer
3、拷贝:将Cudnn解压后的 bin、include、lib三个文件夹直接拷贝到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1 下,会自动合并
4、检测是否安装成功:cmd输入nvcc -V
5、tensorflow下载:
2)Nvidia下的tensorflowGitHub - NVIDIA/tensorflow: An Open Source Machine Learning Framework for Everyone
3)Nvidia下的tensorflow:https://developer.download.nvidia.cn/compute/redist/nvidia-tensorflow/
6、tensorflow,CUDA,cudnn对应版本号查看:Build from source on Windows | TensorFlow
7、torch-gpu下载:https://download.pytorch.org/whl/torch_stable.html
Previous PyTorch Versions | PyTorch
8、其他包:PyPI · The Python Package Index
Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)
通过github代码安装:pip install -e . #注意这个.
9、模型下载:Models - Hugging Face
10、pip安装包
1)通过git连接安装:pip install git github的clone地址
2)通过本地项目安装:进入同setup.py同级的目录下,pip install .
3)直接安装:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名