ubuntu20.04 k8s nvidia-device-plugin: failed to initialize NVML

部署k8s时其中一台机器ubuntu20.04无法获取到显卡数据,其他ubuntu16.04机器可以正常获取显卡数据

主机上可以正常看到显卡信息

 

1.查看pod日志

错误:Failed to initialize NVML: could not load NVML library.

 

2.进入docker

单独启动报同样的错

看一下nvidia-smi

找不到libnvidia-ml.so错误

 

 

加载这个库启动libnvidia-ml.so 试试

成功起来

3.猜测原因可能是docker在ubuntu20.04上运行没有价值nvidia相关的库,考虑启动前先执行ldconfig加载库 

4.修改nvidia-device-plugin的yml 文件的启动方式启动前先执行ldconfig

 5.重新部署后正常

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值