文章目录
- 1. 介绍 Nvidia vGPU 软件
-
- 1.1. NVIDIA vGPU 软件是如何被使用的?
- 1.2. Nvidia vGPU 软件特性
- 1.3. 本指南架构
- 2.1. 关于 NVIDIA vGPU
- 2.2. 使用 NVIDIA vGPU 的先决条件
- 2.3. 切换 M60 或 M6 GPU 模式
- 2.4. 为 Citrix Hypervisor 安装和配置 NVIDIA vGPU 管理器
- 2.5. 为 Linux KVM 安装 vGPU 管理器包
- 2.6. 为红帽企业 Linux KVM 或 RHV 安装和配置 NVIDIA vGPU 管理器
- 2.7. 为 VMware vSphere 安装和配置 NVIDIA vGPU 管理器
- 2.9. 禁用一个或多个 GPU 的 MIG 模式
- 2.10. 禁用和启用 ECC 内存
- 3.2. Citrix Hypervisor 上使用透传 GPU
- 3.3. 红帽企业级 Linux KVM 上使用 GPU 透传
- 3.4. 微软 Windows Server 上使用 GPU 透传
- 3.5. VMware vSphere 上使用 GPU 透传
- 4.1. Windows 上安装 Nvidia vGPU 图形驱动
- 4.2. Linux 上安装 Nvidia vGPU 图形驱动
- 4.3. 为红帽企业级 Linux 禁用 Wayland 显示服务协议
- A. vGPU 类型参考
-
- A.1. vGPU 类型 for Supported GPUs
-
- A.1.1. NVIDIA A100 PCIe 40GB vGPU 类型
- A.1.2. NVIDIA A100 HGX 40GB vGPU 类型
- A.1.9. Tesla P40 vGPU 类型
- A.1.11. Tesla P4 vGPU 类型
- A.1.12. Tesla T4 vGPU 类型
- A.1.12. Tesla T4 vGPU 类型
- A.1.13. Tesla V100 SXM2 vGPU 类型
- A.1.14. Tesla V100 SXM2 32GB vGPU 类型
- A.1.15. Tesla V100 PCIe vGPU 类型
- A.1.16. Tesla V100 PCIe 32GB vGPU 类型
- A.1.17. Tesla V100S PCIe vGPU 类型
- A.1.18. Tesla V100 FHHL vGPU 类型
- A.2. B系列和Q系列 vGPU 的混合显示配置
- B. 在 Linux 服务器上为检查 GPU 配置 x11vnc
- C.~F. 与 Citrix 相关
为管理员提供的文档,解释了如何安装和配置 vGPU 管理器,在透传模式下配置 vGPU 软件并在 VM 操作系统中安装驱动。
1. 介绍 Nvidia vGPU 软件
Nvidia vGPU 软件是一个图形虚拟化平台,提供 VM 访问 Nvidia GPU 的技术。
1.1. NVIDIA vGPU 软件是如何被使用的?
Nvidia GPU 软件有多种使用方式:
1.1.1. Nvidia vGPU
利用部署在非虚拟化操作系统上的相同的 Nvidia 图形驱动,Nvidia vGPU 允许多个 VM 同时直接访问一个单独的物理 GPU。通过这样做,Nvidia vGPU 为 VM 提供了无与伦比的图形性能、计算性能和应用程序兼容性,以及在多个工作负载间共享同一个 GPU 带来的成本高效益和可伸缩性。
更多信息,请见:安装和配置 Nvidia vGPU 管理器
1.1.2. GPU 透传
GPU 透传模式中,一整个物理 GPU 可绕过 Nvidia vGPU Manager,被直接分配到一台 VM 中。在这种操作模式下,运行在 VM 中 Nvidia 驱动可直接独占访问为该 VM 分配的 GPU。GPU 不会在多个 VM 之间共享。
更多信息,请见使用 GPU 透传
1.1.3. 裸金属配置
在裸机部署中,你可以使用 Nvidia vGPU 软件图形驱动、Quadro vDWS 和 GRID 虚拟应用程序 license 来提供远程虚拟桌面和应用程序。如果你想使用不带 hypervisor 的 Tesla 主板来实现以上情况,那么请使用 Nvidia vGPU 软件图形驱动,而不是其他 Nvidia 驱动。
为在裸金属部署中使用 Nvidia vGPU 软件驱动,请完成下面内容:
- 在宿主中安装驱动。教程请见:安装 Nvidia vGPU 软件图形驱动
- 授权你正在使用的 Nvidia vGPU 软件。教程请见:vGPU 客户端授权使用指南
- 为远程访问配置平台。为使用 Tesla GPU 中的图形特性,你必须使用受支持的远程解决方案,例如:RemoteFX,Citrix 虚拟应用程序和桌面,VNC或相似技术。
- 使用宿主 OS 中的显示设置功能将 Tesla GPU 设置为主显示设备。在裸金属平台中 NVIDIA Tesla 一般是作为辅助设备运行。
- 如果系统有多个显示适配器,禁用通过非 Nvidia 生产的适配器进行连接的显示设备。你可以使用宿主 OS 中的显示设置特性或者远程解决方案来达到此目的。在 NVIDIA GPU 上,包括 Tesla GPU,默认显示设备是开启的。只有 Nvidia 适配器驱动的显示设备开启后,用户才能启动需要 NVIDIA GPU 技术来提升用户体验的应用程序。
1.2. Nvidia vGPU 软件特性
NVIDIA vGPU 软件包括 Quadro vDWS, vCS, GRID Virtual PC(vPC) 和 GRID Virtual Applications(vAPP)。
1.2.1. NVIDIA vGPU 软件的 GPU 实例支持
NVIDIA vGPU 软件支持 GPU 上的 GPU 实例,在 Nvidia vGPU 和 GPU 透传部署中支持Multi-Instance GPU (MIG)特性。MIG 允许一个物理 GPU 被安全的切分为多个单独的 GPU 实例,为多个用户提供单独的 GPU 资源来加速他们的应用程序。除了提供 MIG 的所有优点外,NVIDIA vGPU 软件还为工作负载增加了 VM 安全性和管理。SR-IOV 虚拟函数为配置了 vGPU 的 VM 提供全面的 IOMMU 保护。 Figure1 展示了一块 GPU 被切分成3个不同大小的 GPU 实例,每个实例映射到一个 vGPU。即使每个 GPU 实例是被 hypervisor 主机管理且被映射到一个 vGPU,每个 VM 甚至可以在每个 vGPU 上将计算资源再细分更小的计算实例并在其上并行运行多个容器。Figure 1. GPU Instances Configured with NVIDIA vGPU
不是所有 hypervisor 都支持 NVIDIA vGPU 部署中的 GPU 实例。需要确认你选择的 hypervisor 是否支持在 NVIDIA vGPU 部署中的 GPU 实例,可查阅发行版本声明NVIDIA vGPU 软件文档 11.0 到 11.1
NVIDIA vGPU 软件仅在 NVIDIA 虚拟计算服务器(vCS)和 Linux guest 虚拟机操作系统上支持 GPU 实例。
为支持有 NVIDIA vGPU 的 GPU 实例,GPU 必须开启 MIG