[问题已处理]-Error 803- system has unsupported display driver cuda driver combination

导语:同一个镜像在不同的显卡驱动的机器上无法使用gpu 。报错Error 803: system has unsupported display driver / cuda driver combination

查看2个镜像对应的cuda driver

同镜像tag ge2206300210 宿主机驱动465.27 镜像cuda driver是465.27

同镜像 tag ge2206300210宿主机驱动470.63 镜像cuda driver是465.27

这里宿主机的driver挂进去自己修改了软链。

令一个镜像 tag only_cta220630宿主机驱动465.27 镜像cuda driver是470.63

这里宿主机的cuda driver挂载进去了 但是并没有替换镜像里的driver。

令一个镜像 tag only_cta220630宿主机驱动470.63 镜像cuda driver是470.63

也是没问题的。

打开宿主机上/etc/nvidia-container-runtime/config.toml中的debug开关,启动容器,就会看到启动日志(/var/log/nvidia-container-toolkit.log)

[nvidia-container-cli]
debug = "/var/log/nvidia-container-toolkit.log"
log-level = "debug"

测试

确实会mount宿主机上的相关cuda so包。这里已经把对应的libcuda.so.465.27做到镜像里了 所以可能没有对应的挂载日志

这里估计选择了最新的

对于这条做了测试

镜像中存在libcuda.so.465.27 和 libcuda.so.470.63.01时 nvidia-docker会将软链指到libcuda.so.470.63.01

造成这个的原因我认为是低版本的driver不会覆盖镜像中高版本的driver导致,详细可以参考如下图片和链接。

参考

https://zhuanlan.zhihu.com/p/361545761

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爷来辣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值