Vmware 中 Ubuntu 20.04 安装 NVIDIA CUDA以及 cuDNN
为了使用Tensorflow GPU 尝试在vmware中 安装cuda , 但是 vmware不允许直接安装nvidia驱动;
采用 vSphere Bitfusion 技术来间接使用CUDA
参考链接 vSphere Bitfusion
首先安装 vSphere Bitfusion Client on Ubuntu
vSphere Bitfusion Client
前提条件
- 验证您的 Ubuntu 操作系统的版本是否受支持。请参见安装 vSphere Bitfusion 客户端。
- 确认您安装的 vSphere Bitfusion 客户端的版本不高于 vSphere Bitfusion 服务器的版本。请参见升级 vSphere Bitfusion。
安装过程
-
从 VMware 网站 https://packages.vmware.com/bitfusion/ubuntu/ 下载适用于您的 Linux 分发包的 vSphere Bitfusion 客户端。
-
通过运行 apt-get update 命令更新软件包。
sudo apt-get update
-
通过运行
sudo apt-get install -y ./bitfusion_client_version
命令来安装软件包,其中 bitfusion_client_version 是 vSphere Bitfusion 客户端的文件名。例如,
sudo apt-get install -y ./bitfusion-client-ubuntu2004_3.0.0-11_amd64.deb
-
验证 vSphere Bitfusion 客户端的版本。
$ bitfusion version
CUDA
Note! : 因为我要安装的 tensorflow 版本为2.4 通过查询: 对应的CUDA 版本为11 , 故我只需要安装CUDA 11 的版本即可
-
按照官网给的教程, 首先把 cuda 的源 添加到apt里
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
-
使用 wget 命令下载适用于 Ubuntu 20.04 的 NVIDIA CUDA 发行版。
wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda-repo-ubuntu2004-11-3-local_11.3.0-465.19.01-1_amd64.deb
-
使用 dpkg -i 命令安装适用于 Ubuntu 20.04 的 CUDA 11 软件包。
sudo dpkg -i cuda-repo-ubuntu2004-11-3-local_11.3.0-465.19.01-1_amd64.deb
-
使用 apt-key 命令安装密钥以对软件包进行身份验证。
apt-key 命令可管理 apt 用于对软件包进行身份验证的密钥列表。使用这些密钥进行了身份验证的软件包将视为可信。
sudo apt-key add /var/cuda-repo-ubuntu2004-11-3-local/7fa2af80.pub
-
更新并安装 CUDA 软件包。
sudo apt-get update sudo apt-get -y install cuda
-
(可选) 要确认 GPU 分区大小或验证 vSphere Bitfusion 部署上可用的资源,请运行 NVIDIA System Management Interface (nvidia-smi) 监控应用程序。
bitfusion run -n 1 nvidia-smi
-
导航到包含 CUDA 矩阵乘法 (matrixMul) 示例文件的目录 进行测试:
cd /usr/local/cuda/samples/0_Simple/matrixMul
-
针对 matrixMul 示例文件运行 make 和 bitfusion run 命令
sudo make bitfusion run -n 1 ./matrixMul
CUDNN
创建一个 NVIDIA 开发人员帐户,以从该帐户下载与您的 NVIDIA CUDA 版本匹配并适用于您的 Linux 发行版的 cuDNN 软件包。请参见 https://developer.nvidia.com/cudnn。
-
通过运行适用于您的 Linux 发行版的命令序列安装 cuDNN 软件包。
其中
<XXX>
代表你下载的版本-
Ubuntu 版本 20.04
sudo dpkg -i libcudnn<XXX>+cuda11.0_amd64.deb
-
CentOS 8 和 Red Hat Linux 8
sudo rpm -ivh libcudnn<XXX>.cuda11.0.x86_64.rpm
-
-
要验证 cuDNN 是否已安装,请运行
ldconfig -p | grep cudnn
。