openstack-同一物理机中透传不同GPU时的nova配置记录


前言

环境中有一台GPU服务器,新增了一块不同的加速卡,配置一下透传给虚拟机使用


一、不同加速卡的型号信息

原有的三块是V100 32G,新增的是V100 16G

lspci -nn |grep V100
# 输出
18:00.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 SXM2 32GB] [10de:1db5] (rev a1)
5e:00.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 SXM2 32GB] [10de:1db5] (rev a1)
86:00.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 SXM2 32GB] [10de:1db5] (rev a1)
d8:00.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 SXM2 16GB] [10de:1db1] (rev a1)

发现32G的是1db5,16G的是1bd1

二、计算节点增加配置信息

由于这个集群的版本是train版本,按照文档将新的加速卡信息增加进去
train版本nova配置项参考地址:https://docs.openstack.org/nova/train/configuration/config.html

passthrough_whitelist参考配置
在这里插入图片描述

alias参考配置
在这里插入图片描述

1.nova-compute服务的nova.conf

passthrough_whitelist = [{"vendor_id":"10de","product_id":"1db5"},{"vendor_id":"10de","product_id":"1db1"}]
alias={"name":"Tesla V100", "vendor_id":"10de", "product_id":"1db5"}
alias={"name":"Tesla V100 16G", "vendor_id":"10de", "product_id":"1db1"}

配置好之后重启nova-compute服务。

三、控制节点增加配置信息

1.nova-conductor服务的nova.conf

alias={"name":"Tesla V100", "vendor_id":"10de", "product_id":"1db5"}
alias={"name":"Tesla V100 16G", "vendor_id":"10de", "product_id":"1db1"}

2.nova-scheduler服务的nova.conf

alias={"name":"Tesla V100", "vendor_id":"10de", "product_id":"1db5"}
alias={"name":"Tesla V100 16G", "vendor_id":"10de", "product_id":"1db1"}

3.nova-api服务的nova.conf

alias={"name":"Tesla V100", "vendor_id":"10de", "product_id":"1db5"}
alias={"name":"Tesla V100 16G", "vendor_id":"10de", "product_id":"1db1"}

配置好之后重启上述服务。


四、准备实例模版

增加了元数据“pci_passthrough:alias=‘Tesla V100 16G:1’”

openstack flavor show bb2bb087-d299-479a-87b8-b2472c8dab0c
+----------------------------+------------------------------------------+
| Field                      | Value                                    |
+----------------------------+------------------------------------------+
| OS-FLV-DISABLED:disabled   | False                                    |
| OS-FLV-EXT-DATA:ephemeral  | 0                                        |
| access_project_ids         | None                                     |
| disk                       | 600                                      |
| id                         | bb2bb087-d299-479a-87b8-b2472c8dab0c     |
| name                       | v100                            |
| os-flavor-access:is_public | True                                     |
| properties                 | pci_passthrough:alias='Tesla V100 16G:1' |
| ram                        | 57344                                    |
| rxtx_factor                | 1.0                                      |
| swap                       |                                          |
| vcpus                      | 21                                       |
+----------------------------+------------------------------------------+

五、进行测试,创建虚拟机、检查透传结果

在这里插入图片描述
没有问题


总结

记录一下同一个物理机中多块不同GPU加速卡的虚拟机透传配置。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值