因为偶然的原因,需要对一台单节点的GPU服务器进行虚拟化,因此对PVE进行了一些初始学习,对在学习的过程中产生的问题和经验进行记录。
首先还是要感谢各位大佬在各种平台制作的教程及经验分享,但还是避免不了踩了很多坑,对于我在学习过程中使用到的教程我最终会在文章结尾附上,接下来,让我带大家走进一个小白从0开始,照猫画虎的过程。
最开始我是从这个图文教程显卡虚拟化,Tesla P4在PVE8下的vgpu配置方案,兼容多显卡直通 - 哔哩哔哩前言 UP主最近买了一张Tesla P4的显卡,准备折腾一下显卡虚拟化。主要需求来自于我每天都会使用家里的几台虚拟机完成不同的工作任务。因为虚拟机没有显卡所以很多操作比较卡,用着不是那么顺手。也正因为也是办公使用,直通一张高性能显卡性价比比较低,也没法给多台虚拟机使用。正好最近P4显卡价格不贵,所以准备买张来试试。 由于我平时没有使用NAS的方案,所以就没有验证vgpu在NAS下的编解码能力,但是根据其他up主的视频来看,在jellyfin下的编解码是没有问题的。 目前vgpu_unlock项目只支持Tihttps://www.bilibili.com/read/cv33513142/及下面这个视频教程开始,我建议大家先看完这两个教程,再看我的补充内容
第一步是要了解BIOS设置
在视频教程中,up主列出了四项BIOS相关设置,在这里up主一笔带过,未详细介绍四项设置都是什么,通过百度,我为大家附上链接(哈哈哈)
intel主板 | amd主板 | 作用 |
vt-d | iommu | Linux 下检查 VT-d / IOMMU 是否开启_inter主板查看是否支持iommu-CSDN博客 |
vt-x | svm | SVM选项是啥意思?_太平洋汽车 |
Above 4G Decoding | 不知道amd主板有没有这个选项(因为我是intel) | above4gdecoding详解 |
SR-IOV | 不知道amd主板有没有这个选项(因为我是intel) | SR-IOV_sriov-CSDN博客 |
除此之外,还给大家附送一个链接,建议也看看,因为我当时在bios进行设置的时候,在设置
Above 4G Decoding的bios页面,无意中看到了一个VMD的选项,以为不知道VMD是什么,我就打开了,结果导致后面直通显卡的时候,一直提示我的显卡的iommu分组不是单独的,导致挂载不上,请大家注意,在bios设置的时候,遇到不明白的东西一定要百度一下了解清楚,或者像我一样,当时卡在这个地方最终去咸鱼花了30元让别人帮我直通显卡,通过人家的排查,发现了居然是这个当时我手贱产生的问题,太吐血了。
设置完bios,安装完PVE后请大家注意,一定要改DNS地址,修改配置源文件,解决下载的问题,请参考下面的文章
最坑的地方来了,由于后面N卡的驱动兼容性问题,导致如果我们使用最新的PVE版本就会在安装英伟达的vgpu驱动失败,比如我安装的pve版本就是8.2,内核版本远高于文章开头视频教程中博主的6.5.13,此时就需要降级到低版本的内核(不是唯一办法),当时查了好久怎么降级,结果最后在查SR-IOV的时候发现了下面的视频教程,建议大家按照下方的教程进行内核版本降级。
2024陪伴级教程PVE无论什么版本正确开启SR-IOV虚拟化核显方式_哔哩哔哩_bilibili2024陪伴级教程PVE无论什么版本正确开启SR-IOV虚拟化核显方式, 视频播放量 16448、弹幕量 8、点赞数 329、投硬币枚数 192、收藏人数 683、转发人数 39, 视频作者 VedioTalk, 作者简介 QQ群讨论组:52926192,相关视频:2024陪伴级教程PVE最新内核版本6.8.8-3下正确开启SR-IOV虚拟化核显方式,飞牛OS影视功能初体验,对比Plex,jellyfin,PVE安装飞牛OS直通SRIOV核显,核显,N卡vGPU,使用虚拟机,ESXI安装飞牛os,影视体验,直通核显,Sata控制器,网卡,安装vm-tools,PVE 8.2 安装指南 如何正确引导 ZFS RAID1 开启 IOMMU 硬件直通 傲腾固态 M10 妙用,PVE8.1下WIN10直通虚拟PCI核显,pvetools安装PVE不再繁琐,按按回车就行,一、免费的企业级虚拟化平台PVE,proxmox8.2新功能介绍,PVE 8.0 启用vgpu 并让虚拟机获得授权,【Cloud Explained ∙ 第十一期】I/O 设备虚拟化 - SR-IOV,PVE直通原理讲解,10分钟理解直通,新手小白必看!!https://www.bilibili.com/video/BV1XJ4m1T7um/人机验证
https://www.vumstar.com/5739上面是配套的文字教程。
在完成这些准备后,基本就把我在配置前期所遇到的坑能够解决,如果你发现了按照上面的方法做了后还是有问题,记住一定要按照教程,该重启的时候就要重启,尤其是在降级版本内核后,要通过重启才能进入低版本的内核,进入后再去运行up主提供的n卡驱动。
对于up主提供的其他命令大家就可以无脑复制粘贴了,直到最后,关于up主所说的授权服务器的事情,又有一个坑来了。我给大家详细描述一下
在视频教程中,up主一句带过使用docker去配置授权服务器,当时我就蒙了,怎么搞这个docker,然后我就翻了一下评论区,发现up主回复了,他是通过在pve平台虚拟了一台win10主机,然后去跑docker,但同时他也提出了可以直接在pve搞一个LXI去跑(对于这部份我还没有了解清楚),所以我也是在pve上虚拟了一台win10主机,然后安装了 docker desktop,然后我就准备按照up主提供的第一种docker-compose方式去运行(记得在文件中改自己本机ip,关闭本机防火墙),这种方式就是找个地方创建一个名字为docker-compose.yml的文件,然后通过cmd进入这个目录,运行下面的命令:
docker-compose up -d 然后下载完运行完后,发现报错了,根本起不来(最后通过up主文字教程的评论区发现,好像是本机没有SSL证书服务什么的,想了解的可以去看看评论区)
但是当时我并没有发现这个评论,所以我选择去docker run了就是up主提供的第二种方式,大家仔细看的话可以发现,docker-compose和docker run命令里的docker镜像好像不太一样,通过下面的 教程,大家可以看到,在下面的教程中说docker run中的是(二次封装的免证书容器镜像),所以不想折腾的人就用docker run的方式去运行docker,此时授权服务器就搭建ok了(友情提示:docker run里的这个镜像下载较慢,请大家耐心等待)在Proxmox VE下开启vGPU - Tesla P4为例 - 雾时之森 对于 Proxmox VE 8,需要使用16.0+版本的 vGPU 驱动程序,低版本的驱动程序不支持 Linux 6.x 内核 最近我刚升级了我的 NAS 主机,并且购买了一块 Tesla P4 显卡。我想把 vGPU 分配给虚拟机上的 Jellyfin 容器硬解使用,经过几天的研究,我简单总结了使…https://fairysen.com/844.html此时,大家继续按照文章开头的教程去走,该去虚拟机里安装vgpu的驱动了,你以为就OK了吗,并不是的,此时当你安装完vgpu的驱动时,就会发现虚拟机黑屏了,或者变得跟扩展屏一样了,哈哈哈哈,但是不要慌,参考评论区的办法,先把vgpu分离,安装好todesk等远程软件,然后再加上vgpu,就可以通过todesk正常访问了,评论区有人说可以通过win+p调整扩展屏为复制屏,可以通过pve去正常访问虚拟机界面,但是我测试了不行,这个问题有待解决。
到此就是我遇到的所有问题,我发上来记录一下,也给大家分享一下。
再教大家最后一招,实在不行了,去咸鱼花点钱找个技术支持一下也可以,如果需要什么资料,软件可以给我留言,不定期上线。