解决Ubuntu20.04插入英伟达计算卡后无法开机问题-Ubuntu双显卡切换
问题详述
本人新配了一台个人使用的机器学习服务器。对环境配置可能有影响的硬件如下:华硕B660M-plus WIFI D4,intel i7-12700k,英伟达tesla p40计算卡。英伟达tesla p40计算卡(长相类似显卡)是插在pciex16上的专业机器学习计算卡,不具备hdmi等显示输出接口,区别于机器学习常见的GTX和RTX系列显卡,也区别于丽台图形渲染显卡。
本人首先没有使用p40计算卡,仅使用cpu核显将机器点亮,装上了Win10+Ubuntu20双系统,两个系统一切运行良好。
紧接着在靠近cpu的一个pciex16接口上插上了tesla p40计算卡。
首先在win10上装了cuda10.2以及与之配套的驱动、cudnn、anaocnda、python、torch、torchvision,并成功运行了一个之前做过的机器学习项目,顺利完成。这说明卡和电脑本身都没问题。
其次,准备在ubuntu环境下配置环境。但是这时ubuntu突然打不开了。具体情况是,在ubuntu的grub界面选择启动ubuntu,紧接着没有进入登录界面,而是会黑屏报错,错误是什么intel version、usb、hdaudio等等的外设问题(前面一个开机的秒数,然后是具体的错误内容这样),我又将tesla p40计算卡从主板上拔了下来,ubuntu又恢复如初,能够重新正常开机进入系统,没有报错。这显然说明上面所述的报错并非导致无法开机的致命错误,问题出在这张英伟达p40计算卡上。
问题分析
问题出在这个英伟达计算卡上面。因为专业的tesla等系列计算