NVIDIA&GRID vGPU软件-中文用户指南（上）

NVIDIA vGPU软件是一种GPU虚拟化平台，为虚拟机（VMs）提供对NVIDIA GPU访问的技术。 NVIDIA vGPU软件允许多个虚拟机实例共享一块物理GPU，从而提高了虚拟化环境中图形处理的性能和效率。通过将NVIDIA GPU技术引入虚拟化环境，用户可以在虚拟机中运行需要高性能图形处理的应用程序，如3D渲染、机器学习和科学计算等。这种虚拟化平台使得在虚拟化环境中使用GPU变得更加灵活和高效，为用户提供了更好的图形处理能力和性能。

1.1 如何使用NVIDIA vGPU软件

NVIDIA vGPU软件可以通过多种方式使用。

1.1.1 英伟达vGPU

NVIDIA虚拟GPU（vGPU）使多个虚拟机（VMs）能够同时直接访问单个物理GPU，使用与非虚拟化操作系统上部署的相同的NVIDIA图形驱动程序。通过这种方式，NVIDIA vGPU为虚拟机提供了无与伦比的图形性能、计算性能和应用程序兼容性，同时通过在多个工作负载之间共享GPU带来的成本效益和可扩展性。NVIDIA vGPU软件允许多个虚拟机实例共享一块物理GPU，从而提高了虚拟化环境中图形处理的性能和效率。通过在虚拟化环境中使用与非虚拟化操作系统相同的NVIDIA图形驱动程序，用户可以获得出色的图形处理性能、计算性能和应用程序兼容性。这种虚拟化平台使得在虚拟化环境中使用GPU变得更加灵活和高效，为用户提供了更好的图形处理能力和性能。

1.1.2 GPU直通

GPU直通模式是指将一整块物理GPU直接分配给一台虚拟机使用。绕过NVIDIA虚拟GPU管理器。在此模式下，GPU被分配给它的虚拟机中运行的NVIDIA驱动程序独占访问。虚拟机之间不共享GPU。

1.1.3 裸金属服务器部署

在裸金属部署场景下，可以使用NVIDIA vGPU软件驱动vWS和vApps授权，提供远程虚拟桌面和应用。如果你想要使用没有管理程序的GPU卡，请使用NVIDIA vGPU软件图形驱动程序，而不是其他NVIDIA驱动程序。

要在裸机部署中使用NVIDIA vGPU软件驱动程序，请完成以下任务:

1. 在物理主机上安装驱动程序
具体操作请参见《安装NVIDIA vGPU软件显卡驱动程序》。

2. 授权您正在使用的任何NVIDIA vGPU软件。

有关说明，请参阅《Virtual GPU Software Client Licensing》

3. 配置远程访问平台。
要使用gpu的图形功能，必须使用支持的远程控制解决方案，例如RemoteFX、Citrix Virtual Apps and desktop、VNC等技术。

4. 使用主机操作系统的“显示设置”特性，将GPU卡配置为主要显示输出设备。

NVIDIA 显卡通常作为裸机平台上的辅助设备运行。

5. 如果系统有多个显示器接口，请禁用通过该显示器接口连接的非NVIDIA的GPU显示设备。
可以使用主机操作系统自带的显示设置特性，也可以使用远程解决方案自带的显示设置特性
为此目的。在NVIDIA gpu上，包括Tesla gpu，默认的显示设备是启用。
用户可以启动需要NVIDIA GPU技术的应用程序，以增强用户只有在启用NVIDIA适配器驱动的显示器后才能体验。

1.2 NVIDIA vGPU软件部署对主要的显示适配器要求

设置为主显示适配器的GPU不能用于NVIDIA vGPU部署或GPU直通部署。

任何正在用于NVIDIA vGPU部署或GPU直通部署必须将部署设置为辅助显示适配器。

注意:Citrix Hypervisor提供了一个特定的设置，允许使用主显示适配器用于GPU直通部署。

仅支持以下gpu作为主显示适配器:

‣ Tesla M6
‣ Quadro RTX 6000
‣ Quadro RTX 8000

所有支持NVIDIA vGPU软件的gpu不能作为主显示器因为它们是3D控制器，而不是VGA设备。
如果虚拟机管理程序主机没有额外的图形适配器，请考虑安装低端适配器将用作主显示适配器。如有必要，请确保这一点主显示适配器在hypervisor主机的BIOS选项中设置正确。

1.3 NVIDIA vGPU软件功能

NVIDIA vGPU软件包括vWS、vCS、vPC和vApps。

1.3.1 NVIDIA vGPU支持GPU实例软件

NVIDIA vGPU软件支持多实例GPU上的GPU实例
NVIDIA vGPU和GPU直通部署中的GPU（MIG）功能。

MIG使物理GPU被安全地划分为多个单独的GPU实例，提供多个用户使用单独的GPU资源来加速他们的应用程序

除了提供MIG的所有好处外，NVIDIA vGPU软件还添加了虚拟机安全和工作负载管理。单根I/O虚拟化（SRIOV）虚拟功能为以下虚拟机提供完整的IOMMU保护配置了vGPU。

图1显示了一个GPU，它被分成三个不同大小的GPU实例，每个实例映射到一个vGPU。尽管每个GPU实例都由并且映射到一个vGPU，每个虚拟机可以进一步细分将计算资源划分为较小的计算实例并在其上运行多个容器即使在每个vGPU中，也可以并行运行。

配置了NVIDIA vGPU的GPU实例

NVIDIA vGPU软件支持带DEC、JPG和OFA的单片MIG支持的vGPU。只有一个支持DEC、JPG和OFA的MIG支持的vGPU可以驻留在GPU。该实例可以被放置为与没有DEC、JPG、PNG或PNG的单个切片实例相同，以及OFA支持。

并非所有管理程序都支持NVIDIA vGPU部署中的GPU实例。来确定您选择的管理程序支持NVIDIA vGPU部署中的GPU实例，请看NVIDIA Virtual GPU Software v15.0 through 15.4 - NVIDIA Docs。
NVIDIA vGPU软件仅支持使用NVIDIA Virtual Compute Server的GPU实例和Linux客户机操作系统。

要使用NVIDIA vGPU支持GPU实例，GPU必须配置为MIG模式启用和GPU实例必须在物理GPU上创建和配置。更多信息，请参阅为《MIG支持的vGPU配置GPU》。一般信息有关MIG功能，请参阅：NVIDIA Multi-Instance GPU User Guide。

1.3.2 API对NVIDIA vGPU的支持

NVIDIA vGPU包括对以下API的支持：

‣ Open Computing Language (OpenCL™ software) 3.0
‣ OpenGL® 4.6
‣ Vulkan® 1.3
‣ DirectX 11
‣ DirectX 12 (Windows 10)
‣ Direct2D
‣ DirectX Video Acceleration (DXVA)
‣ NVIDIA® CUDA® 12.0
‣ NVIDIA vGPU software SDK (remote graphics acceleration)
‣ NVIDIA RTX (on GPUs based on the NVIDIA Volta graphic architecture and later
architectures)

注意：这些API向后兼容。API的旧版本也受支持。

1.3.3 NVIDIA vGPU软件支持的NVIDIA CUDA工具包和OpenCL

NVIDIA vGPU仅在以下子集上支持NVIDIA CUDA工具包和OpenCL
vGPU类型和支持的GPU。

注意：
如果您在Linux上使用带有CUDA的NVIDIA vGPU软件，请避免安装冲突方法通过从独立于发行版的run文件包安装CUDA。不要从特定于发行版的RPM或Deb软件包安装CUDA。确保CUDA被覆盖时，NVIDIA vGPU软件图形驱动程序不会被覆盖安装后，在选择要安装的CUDA组件时取消选择CUDA驱动程序。了解更多信息http://docs.nvidia.com/cuda/archive/12.0/pdf/CUDA_Installation_Guide_Linux.pdf

OpenCL和CUDA应用程序支持

以下NVIDIA vGPU类型支持OpenCL和CUDA应用程序：

‣ The 8Q vGPU type on Tesla M6, Tesla M10, and Tesla M60 GPUs
‣ All Q-series vGPU types on the following GPUs:
‣ Since 15.2: NVIDIA L4

‣ Since 15.1: NVIDIA L40
‣ Since 15.1: NVIDIA RTX 6000 Ada
‣ NVIDIA A2
‣ NVIDIA A10
‣ NVIDIA A16
‣ NVIDIA A40
‣ NVIDIA RTX A5000
‣ NVIDIA RTX A5500
‣ NVIDIA RTX A6000
‣ Tesla P4
‣ Tesla P6
‣ Tesla P40
‣ Tesla P100 SXM2 16 GB
‣ Tesla P100 PCIe 16 GB
‣ Tesla P100 PCIe 12 GB
‣ Tesla V100 SXM2
‣ Tesla V100 SXM2 32GB
‣ Tesla V100 PCIe
‣ Tesla V100 PCIe 32GB
‣ Tesla V100S PCIe 32GB
‣ Tesla V100 FHHL
‣ Tesla T4
‣ Quadro RTX 6000
‣ Quadro RTX 6000 passive
‣ Quadro RTX 8000
‣ Quadro RTX 8000 passive
‣ All C-series vGPU types

NVIDIA CUDA工具包开发工具支持

NVIDIA vGPU支持以下NVIDIA CUDA Toolkit开发工具
GPU：

‣ Debuggers:
‣ CUDA-GDB
‣ Compute Sanitizer
‣ Profilers:

‣ The Activity, Callback, and Profiling APIs of the CUDA Profiling Tools Interface
(CUPTI)
Other CUPTI APIs, such as the Event and Metric APIs, are not supported.