开启和关闭MIG模式都需要reboot
开启和关闭MIG模式都需要reboot
开启和关闭MIG模式都需要reboot
特定的N卡才支持MIG,比如A100,A30,H100
打开MIG模式
nvidia-smi -mig 1
重启机器
查看支持划分的MIG规格 -i 接的是物理GPU序号
nvidia-smi mig -i 0 -lgip
划分mig设备 -cgi 后面接的是上面看到的id
nvidia-smi mig -i 0 -cgi 9,14,19,19
创建计算模块
nvidia-smi mig -i 0 -cci
查看是不是成功了
nvidia-smi -L
能看到带有mig设备的GPU
kubernetes中,mixStrategy支持none,mixed,single. device-plugin至少要v0.7.0
mixed是混合模式,即整卡、不同规格的mig设备混合模式上报给节点
single是单一的mig规格的设备,有不同的规格,device-plugin会报错。