打算用阿里云的虚拟化型GPU服务器部署深度学习模型,但是在研究了两天后也没成功安装NVIDIA驱动,服务器具体信息如下
当我选择了这个服务器后,问题就来了,如果是计算型GPU,那可以自动安装环境和驱动,不过需要等一些时间(有赚黑钱嫌疑),但虚拟化型还要自己安装NVIDIA驱动,我们的ubuntu版本号是18.04.2,linux内核是4.15.0,打算安装cuda10.1以及NVIDIA-Linux-x86_64-418.87.00的驱动,但是试了一天,各种方法都行不通,后来查看了NVIDIA的文档,发现了这么一张表
表里没有Ubuntu18.04.2,然后就打算按表里来,选择升级Ubuntu18.04.3以及llinux内核5.0.0,GLIBC还是2.2.7。原以为问题应该能解决了,但是还是不行,现在开始怀疑是否是虚拟化型GPU的锅,在各大论坛一直没有找到虚拟化型GPU相关的问题,而阿里云在介绍这个产品时是有深度学习推理的功能的,说明应该能实现
在ECS文档中也没有找到vgn5i安装NVIDIA驱动的方法,这个问题目前是没法解决了。
然而,我发现模型的推理在这台服务器用CPU也能work,事实上,模型的推理不需要太大的计算量,所以目前不需要一台gpu服务器做推理工作。如果要训练的话,也需要更好的GPU。
阿里云虚拟化型GPU TeslaP4 ubuntu安装NVIDIA驱动问题
最新推荐文章于 2024-10-27 18:50:22 发布