NVIDIA P40 VGPU部署GRID安装(超详细)

1.NVIDIA注册90天免费lisence, 可获取500个测试

https://ui.licensing.nvidia.com/

在这里插入图片描述

注册步骤:https://docs.nvidia.com/grid/10.0/grid-software-quick-start-guide/index.html

2.vsphere 的安装:

2.1选择版本(6.7----8.4)

在这里插入图片描述

为何要选择6.7版本(Enterprise
Plus):https://docs.nvidia.com/grid/10.0/grid-vgpu-release-notes-vmware-vsphere/index.html

在这里插入图片描述

2.2.vsphere官方下载测试60天的。

 2.2.1.下载安装,略,百度一大把;

在这里插入图片描述

    6.5版本之后,可用这个web ui登陆

 2.2.2 熟悉下里面配置,如何生成虚机等

        上传镜像:win10,win2k12 server,win2k16 server等

在这里插入图片描述

画个拓扑把,接下来怎么测跟分配资源:

官方:

在这里插入图片描述

实际:

在这里插入图片描述

    VM-200.154:   win10-lisence-server      (java8)

    VM-200.153    win2k12-vsphere-vcenter    (一开始没装,调整虚拟机硬件,在ui 上不能实现,一个大坑)

    VM-200.155    win2k12--测试vgpu       (grid 驱动版本)

    VM-200.156     linux-测试vgpu  (待测试把\~\~\~)

   都跑在一台server上,桥接网卡,测试嘛,简单点。。。

3.开搞

   3.1 vsphere6.7 安装vgpu 驱动:

      3.1.1 开启ssh服务;

      3.1.2.上传nvidia 驱动; 

在这里插入图片描述

     3.1.3. 命令行操作:

           a .   SSH到ESXi,使用命令:**lspci \| grep NVIDIA** 来检         

在这里插入图片描述

          b.  cd  /vmfs/volumes/5f11ac22-40a99ea2-38ca-1c1b0df9c665/nvidia

目录,增加可执行权限

        esxcli software vib install -v /vmfs/volumes/5f11ac22-40a99ea2-38ca-1c1b0df9c665/nvidia/NVIDIA-VMware-440.107-1OEM.670.0.0.8169922.x86_64.vib --maintenance-mode   

在这里插入图片描述

      esxi主机需在维护状态(maintenance-mode ),也可以在ui 那直接点击

等待几分钟,安装成功以后会有提示信息,可能在安装信息中提示不需要重启,但是强烈建议重启一下主机来验证驱动是否正常,有碰到过重启以后驱动报错的情况。
在这里插入图片描述

重启完主机以后使用 nvidia-smi 命令来验证驱动是否正常,正常情况下能看到类似如下信息:

在这里插入图片描述

 特别注意2点:
 1、ECC模式是否显示off 
 2、默认情况下vSphere会使用vsga模式,而不是vGPU模式;

 使用命令来关闭ECC,注意,启用或者关闭ECC都需要重启主机。

  **nvidia-smi -e 0**

ECC 状态为OFF

在这里插入图片描述

    至此,驱动安装完毕, 退出维护模式

     检验下:nvidia-smi vgpu -q -s

在这里插入图片描述

  3.1.4  登陆200.153  Vcenter操作  vcenter安装步骤,可自行百度

在这里插入图片描述

定位到主机-配置-图形,编辑主机图形设置,可以看到默认是共享模式,也就是vsga,我们需要切换到**“直接共享“**才能使用vGPU。

在这里插入图片描述
在这里插入图片描述

默认最佳性能模式,会在所有可能的GPU上去运行虚拟机,即VM1运行在GPU1、VM2运行在GPU2,以此类推,尽可能平均的分布虚拟机,不会让GPU闲着。

GPU整合模式,会在一个GPU核心上运行先启动的虚拟机,直到当前GPU没有资源才会去使用下一个GPU核心,这个模式多用在同一台服务器上运行多个vGPU
profile的情况下。

PS:针对单个gpu卡,也可设置其他模式, 变更后需要重启x’org服务

在这里插入图片描述

 4  Lisence-server 安装部署:

      1.vm-200.154,win10 系统

      2. 安装java,设置环境变量

      3.安装ls-winserver  

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

**************碰到的问题,window server 未安装通用C

4.在nvidia center下发权限

       4.1   200.154上,hostID----mac地址

在这里插入图片描述

 4.2 

在这里插入图片描述
在这里插入图片描述

    下载后,上传至200.154上

在这里插入图片描述

会出现,scuess ,ok

5. 测试vm-200.155

 1. vm-155 ,关机

 2.编辑设置:

在这里插入图片描述

   3.上传grid 驱动,安装

在这里插入图片描述

   4. 安装完毕

在这里插入图片描述

  1. linsence注册

在这里插入图片描述

   至此, windows 2012 server  完成!!

==============================

============参考链接

  1. https://docs.nvidia.com/grid/10.0/grid-vgpu-user-guide/index.html#modify-gpu-assignment-gpu-enabled-vms-vmware-vsphere

  2. http://vgpu.com.cn/vmware.html
    参考链接

  3. https://docs.nvidia.com/grid/10.0/grid-vgpu-user-guide/index.html#modify-gpu-assignment-gpu-enabled-vms-vmware-vsphere

  4. http://vgpu.com.cn/vmware.html

  • 2
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值