经过一些折腾,中间重装过系统、碰到一些奇怪的问题,最后环境搭建成功。
网上已经有很多内容描述细节,因此本文只把关键步骤写下来做参考。
<1> 正确步骤
关键的点:
- 操作系统、GPU驱动、tensorflow版本、CUDA版本、CuDNN版本需要匹配上。这步看似废话,但是至关重要,否则就可能会碰到各类“难缠”的奇怪问题
- 如果使用 Anaconda 安装tensorflow 开发环境,那么操作系统安装后,只需要在操作系统上直接安装 GPU 驱动,而不用安装CUDA 和 CuDNN 驱动,因为 Anaconda 安装tensorflow 时会自己在 Conda Env 里安装 Cuda 和 CuDNN 驱动
成功安装的步骤:
- 安装操作系统:ubuntu 20.04
- 在操作系统上直接安装: nvidia gpu驱动 510.73.05(GPU是rtx 3060 laptop)
- 安装Anaconda
- 在Anaconda上:安装tensorflow 开发环境,安装 tensorflow-gpu 2.8,cuda 11.6.0(安装 tf-gpu时自动顺带安装),cudnn 8.4.0.27(安装 tf-gpu时自动顺带安装)
- 安装 pycharm,然后在项目中绑定 conda env,之后便可以在里面开发运行调试代码
安装步骤中 conda 相关的几个命令:
conda create -n TF280-GPU python=3.8.0