NVIDIA vGPU License服务器及GPU驱动部署配置详解

一、背景

在Horizon Daas环境,因部分桌面虚拟机采用vGPU规格发布,因此环境中需要有GPU License服务器,完成对租户环境的GPU许可。

当配置有vGPU桌面虚拟机发起License请求后,该服务器会根据License中所包含的GRID License版本,加载不同的vGPU驱动(普通驱动和专业Quodra卡驱动)。目前vPC和vApp的License对应加载的都是普通的显示驱动。

二、vGPU License服务器的工作原理

vGPU跟传统的GPU类似,具有固定数量的GPU帧缓冲器和一个或多个虚拟显示输出。在vGPU虚拟机被创建的时候,帧缓冲区就被分配到物理GPU的帧缓冲区中,vGPU保留对该缓冲区的独占使用,直到它被销毁为止。留在物理GPU上的所有vGPU虚拟机共享对GPU引擎的访问,包括图形(3D)、视频编解码引擎等。

NVIDIA vGPU的内部架构:

在这里插入图片描述
每次vGPU的虚拟机运行的时候都会向License服务器发起License请求:
在这里插入图片描述
GRID分为三个版本:
虚拟工作站vDWS、vPC和虚拟应用vApps,当配置有vGPU虚拟机发起License请求时,GL服务器会根据License中所包含的GRID License版本,加载不同的vGPU驱动(普通驱动和专业Quodra卡驱动)。目前vPC和vApp的License对应加载的都是普通的显示驱动。

在这里插入图片描述
整个License获取和释放的过程发生在如下两个阶段:

1、License获取阶段:

虚拟机在启动的时候通过访问License服务器的地址+端口7070发起License的请求,当正常获取License后加载GRID驱动

2、License释放阶段:

关闭虚拟机的时候,之前虚拟机获得的License会自动释放,还回到License服务器中。
虚拟机处于关闭状态的时候是不占用任何GRID License的。只有在使用Tesla M60/M10 GPU 时,GRID虚拟工作站或虚拟PC的license版本须经由网络从NVIDIA GRID License 服务器获取到license使用。

vGPU License服务器注意事项(重要):

1)具有16GB内存的4个CPU的高端配置,适合处理多达15万个许可客户端。主机平台必须运行支持的Windows操作系统

2)NVIDIA License Server尽量安装在英文版操作系统(或使用英文版的浏览器)中,不然会产生与web浏览器不兼容的情况

3)平台必须具有固定(不变)IP地址。平台必须至少有一个不变的以太网MAC地址,以便在注册服务器和在NVIDIA许可门户网站中生成许可证时用作唯一标识符

4)平台的日期/时间必须准确设置。

三、GPU License服务器搭建

在这里插入图片描述

3.1、License server软件包获取

使用GRID驱动必须申请相应的License,同时需要将License部署在License Server上;我们先获取安装介质,打开NVIDIA官网地址:http://www.nvidia.com/object/grid-evaluation.html,点击下载软件链接“Software Download”

在这里插入图片描述
或者:https://nvid.nvidia.com/dashboard/
在这里插入图片描述
License软件包介绍:通过上述步骤,可下载到License Manager压缩包:

NVIDIA-GRID-windows-XXXX.XX-XXXX.zip

NVIDIA-GRID-linux-XXXX.XX-XXXX.tgz

Windows安装包,解压后可获取:

setup.exe:用于安装于Windows 虚拟机上

GRID License Server User Guide.pdf:Windows License 服务器用户指南

GRID License Server Release Notes.pdf:Windows License服务器版本说明

在这里插入图片描述

Linux安装包,解压后可获取,更多参看官方文档

setup.bin :用于安装于Linux虚拟机上

GRID License Server User Guide.pdf :Linux License 服务器用户指南

GRID License Server Release Notes.pdf :Linux License服务器版本说明

重要二:获取产品密钥(PAK)

  • 获取方法一:从NVIDIA销售处下单并处理订单后,您会收到包含产品激活密钥的欢迎电子邮件。此邮件包含产品激活密钥(PAK);

  • 获取方法二:如果下单后只拿到许可密钥,可以通过许可密钥为您的账户兑换产品激活密钥(PAK),依次点击:Software & Services Redeem Product Activation Keys,进入Redeem Product Activation Keys页面,在下方表单中输入许可密钥进行兑换。

3.2、License server 安装

在win2016_server_license服务器上,解压获取到的License软件安装包,NVIDIA-ls-windows-XXXX.XX-XXXX.zip包,运行setup.exe
在这里插入图片描述

选择: “I accept the terms of the license Agreement” ,点击 Next; 选择: “Iaccept the terms of the license Agreement”,点击 Next;可自定义安装路径,这里选择默认,点击 Next;默认勾选: “License server(port 7070)”,需要勾选上“Managementinterface (port 8080)” ,点击Next;

在这里插入图片描述
点击“Install”进行安装,等待安装完成,点击”Done”,完成安装。

对于Linux需要Java和Tomcat Server 环境,确认后执行如下安装:

unzip NVIDIA-ls-linux-…….zip
cd NVIDIA-ls-linux-……/
chmod +x setup.bin
sudo ./setup.bin -i console  #按交互操作,指定tomcat路径
#验证
systemctl status flexnetls-nvidia nvidia nvidia

在这里插入图片描述

3.3、管理

验证许可证服务器是否正常运行,在license服务器主机上打开Web浏览器并连接到http:// localhost:8080/ licserver,显示License管理界面。

在这里插入图片描述
1)获取License文件

首先获取MAC地址,在License管理界面,打开License Server Configuration,通过Server hostID,获取到MAC地址,如下图所示:

在这里插入图片描述

2)注册License服务

因该服务器可直接访问公网,浏览器直接打开NVIDIA官网登录到”NVIDIA SOFTWARE LICENSING CENTER”页面。依次点击:Grid Licensingà Register License Server,进入Register License Server页面,将获取到的MAC地址,输入“MAC address”中,并点击“Create”,如下图所示:

在这里插入图片描述
创建完成后,需要进入分配license页面。注意事项:

1、MAC地址指的是GL许可服务器的地址,MAC地址之间不要有冒号;

2、如果没有执行本步骤,会导致导出的BIN文件中,没有真实可用的license信息。

然后在View Server页面单击“Map Add-Ons”,会显示目前账号一共可以分配的用户数。

在这里插入图片描述
在Qty to Add框中填入需要分配的用户数量,然后点击Map Add-Ons就完成了分配。分配的数量可以通过该步骤进行添加和删除,但是测试license不允许调低分配的用户数。
在这里插入图片描述

3)下载License文件

创建完后,生成许可证*.bin文件,并下载保存到icense服务器上。

在这里插入图片描述

在这里插入图片描述

4)加载License文件

在License服务器上,打开Licnese Management界面,GL服务器管理平台的地址是:http://localhost:8080/licserver, 显示License管理界面,从左侧菜单,依次点击:LicenseServer -> License Management,使用License服务器配置菜单导入,刚下载保存好的许可证*.bin文件,并点击Upload。如下图所示:

在这里插入图片描述

至此,GPU_License服务器安装完成。

3.4、vGPU License服务器常见问题

NVIDIA vGPU License Server组件是我们在实际生产部署以及搭建POC环境的过程中的重要环节。当一个vGPU虚拟机没有正常获取License的时候,其功能会受到很大的限制。由于测试License的申请,以及安装部署过程的注意事项,稍微大意或者缺乏耐心都有可能导致License组件部署失败,以至于影响整个POC测试的效果,所以做这种操作之时要足够仔细、严格按照官方指导要求来!以下是NVIDIAvGPU License Server组件相关的问题进行的总结,供各位参考。

1.在成功提交测试License申请后,1-2个工作日依然没有收到测试License。

测试License申请:http://www.nvidia.com/object/nvidia-enterprise-account.html

2.收到测试License PAK(激活码)后,登陆NVIDIA企业门户激活PAK失败。

建议:多数情况下都是由于网络原因导致(激活服务器在国外),所以建议不断的重试PAK的激活操作,此部分操作对耐心有一定的要求。

3.安装部署License组件版本的选择

建议:选择最新的License组件版本安装,新的License组件版本会对之前的版本会有BUG的修复,所以最新版本是一个很好的选择。

4.成功安装部署License组件后,发现License Web管理界面并不能成功的打开

建议:极有可能的一个原因是你安装了JAVA 7,而新的Li

wget是一个强大的Linux命令行工具,它支持多种协议下载,如FTP、HTTP,并且具备断点续传和限速下载等实用功能。当你需要对下载任务进行控制时,这些功能显得尤为关键。 参考资源链接:[Linux wget命令详解与实用技巧](https://wenku.csdn.net/doc/3n9azudyov?spm=1055.2569.3001.10343) 断点续传功能允许下载任务在意外中断后,从上次中断的地方继续下载,而不是重新开始。要实现断点续传,只需要在wget命令后加上`-c`参数。例如,当你需要继续下载一个之前中断的文件时,可以使用如下命令: ```bash wget -c http://example.com/file.zip ``` 这条命令会尝试连接到指定的URL,并检查已下载的内容,然后继续完成剩余的下载部分。 至于限速下载,通过`--limit-rate`参数,用户可以设置wget下载的最大速度。这个参数的值可以是字节、千字节(KB)或兆字节(MB)每秒。例如,若你想将下载速度限制在500KB/s,可以使用以下命令: ```bash wget --limit-rate=500k http://example.com/file.zip ``` 在这个命令中,`-limit-rate=500k`参数将确保下载速度不会超过500KB/s。 这两个功能结合起来使用时,不仅可以帮助用户有效管理带宽资源,还能在面对不稳定的网络环境时,保证下载任务的顺利进行。对于系统管理员或需要频繁进行文件传输的用户来说,wget提供了一个可靠且灵活的解决方案。 如果你希望深入了解wget的更多功能和技巧,包括如何配置代理服务器、如何设置下载超时等,可以参考《Linux wget命令详解与实用技巧》这篇文章。该文章提供了丰富的实例和详细解释,能够帮助你更好地掌握wget的使用,并在各种网络管理场合中发挥其强大功能。 参考资源链接:[Linux wget命令详解与实用技巧](https://wenku.csdn.net/doc/3n9azudyov?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

羌俊恩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值