https://www.tensorflow.org/install/source?hl=zh-tw
由于TF2GPU最新仅更新到CUDA11.2版本,于是为了所有都兼容,操作系统选择了Ubuntu 20.04.6 LTS。
1. 打开终端。Assume you newly installed Ubuntu 20.04. Execute the following:
$ sudo apt-get update
$ sudo apt-get upgrade
$ sudo apt-get install build-essential
2. Install nvidia driver
https://www.nvidia.cn/geforce/drivers/
查看电脑的显卡型号:
lspci | grep -i nvidia
如果没有显示,可以在设置-关于获取。进入网站选择自己的显卡型号。
选择想要下载的驱动版本,并点击 “获取下载” 进行下载。
这些版本都可以使用,只不过不同版本对应的cuda版本不一样,对应的cudnn版本也就不一样,最后支持的pytorch版本也就不一样,所以,选择哪个版本都行,只不过后续安装cuda、cudnn、pytorch的时候需要进行版本对应。
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
通过上面链接已知Nvidia的驱动只需要安装最新发布的即可。
如果想安装老版本的驱动,可以通过下面的链接下载。Linux AMD64 Display Driver Archive | NVIDIA
备注:Linux安装Nvidia显卡驱动+CUDA+cuDNN+PyTorch - 知乎
Chapter 4. Installing the NVIDIA Driver
(我这里按照上面链接的教程禁用Nouveau驱动)
下载了NVIDIA-Linux-x86_64-550.40.07.run后,install by using following command:
sudo sh NVIDIA-Linux-x86_64-550.40.07.run
重启电脑。
Then, verify by typing $
nvidia-smi
in the terminal.
Remarks:原本下载550版本,后来用以下命令查看,推荐
driver : nvidia-driver-535-server-open - distro non-free recommended
于是重新下载了NVIDIA-Linux-x86_64-535.154.05.run
ubuntu-drivers --help
ubuntu-drivers devices
3. Download CUDA Toolkit 11.2 from the official website.
wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda_11.2.2_460.32.03_linux.run
sudo sh cuda_11.2.2_460.32.03_linux.run
在运行上面两个命令前,先运行以下命令查看
ulimit -a
假如stack size (kbytes, -s) 8192太小,执行以下命令
ulimit -s 102400
并且安装 gcc/cmake
Installation Guide Linux :: CUDA Toolkit Documentation
apt-get install build-essential
apt-get install cmake
检查是否安装成功:
gcc --version
cmake --version
有版本号显示说明安装成功。然后再执行刚刚CUDA的两个命令。
4. Set the environment variables as follows:
这里不详细说,别人的教程里有,具体看以下链接:
https://velog.io/@le4m/Install-CUDA11.1-on-Ubuntu20.04
备注:另外一些安装教程(需要就看)https://yakhyo.medium.com/cuda-11-2-installation-on-ubuntu-20-04-e83f7561ccc1
Linux安装Nvidia显卡驱动+CUDA+cuDNN+PyTorch - 知乎(重复)
5. 安装cuDNN
cuDNN Archive | NVIDIA Developer
注册账户并且选择Download cuDNN v8.1.1 (Feburary 26th, 2021), for CUDA 11.0,11.1 and 11.2
6. 安装Anaconda,并且创建环境
我选择的是64-Bit (x86) Installer (1015.6 MB)
conda create -n tf2gpu python=3.9.18
conda activate tf2gpu
在激活的虚拟环境中,执行以下命令安装TensorFlow及其相关依赖包:
conda install -c conda-forge
cudatoolkit=11.2 cudnn=8.1.0
pip install --upgrade pip
pip install "tensorflow-gpu<2.11"
7. 测试
import tensorflow as tf
print(tf.__version__)
print("GPU Available:", tf.test.is_gpu_available())