深入理解 nvidia-docker 2.0

最新推荐文章于 2024-08-08 08:12:52 发布

ZVAyIVqt0UFji

最新推荐文章于 2024-08-08 08:12:52 发布

阅读量1.5k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZVAyIVqt0UFji/article/details/85813685

版权

本文详细介绍了nvidia-docker 2.0相对于1.0的设计优势和实现机制，阐述了其如何在不依赖特定容器运行时的情况下，通过nvidia-container-runtime和libnvidia-container库支持GPU容器的创建和管理，以及与docker、containerd和runc的关系。

摘要由CSDN通过智能技术生成

女主宣言

上篇推送我们介绍了 nvidia-docker 2.0 在我司大规模 Kubernetes 集群上的实践，本篇文章就将介绍相较于旧版本，nvidia-docker 2.0 的设计优势及其实现机制，希望能对大家有所帮助。本文首发于 OpsDev.cn，转载已获取作者授权。

PS：丰富的一线技术、多元化的表现形式，尽在“HULK一线技术杂谈”，点关注哦！

640?wx_fmt=jpeg

The 50th Anniversary of Apollo 8's Launch

by NASA IOTD

NVIDIA于2016年开始设计NVIDIA-Docker已便于容器使用NVIDIA GPUs。第一代nvidia-docker1.0实现了对docker client的封装，并在容器启动时，将必要的GPU device和libraries挂载到容器中。

1

nvidia-docker 存在的问题

但是这种设计的方式高度的与docker运行时耦合，缺乏灵活性。存在的缺陷具体如下:

设计高度与docker耦合，不支持其它的容器运行时。如: LXC, CRI-O及未来可能会增加的容器运行时。
不能更好的利用docker生态的其它工具。如: docker compose。
不能将GPU作为调度系统的一种资源来进行灵活的调度。
完善容器运行时对GPU的支持。如: 自动的获取用户层面的NVIDIA Driver libraries, NVIDIA kernel modules, device ordering等。

基于上面描述的这些弊端，NVIDIA开始了对下一代容器运行时的设计: nvidia-docker2.0。

2

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。