ubuntu 18.04 两张GPU显卡,nvidia-smi只显示一张
环境:ubuntu 18.04 + 2张NVIDIA RTX 2080TI + cuda10;
现象如图:
nvidia-smi结果只显示其中一张显卡;
排查过程:
1. BIOS能检测PCI两张显卡;正常;
调换位置也能检测到,基本排除硬件问题;
2. lspci |grep NVIDIA结果
两张显卡显示正常;
3.ls -l /dev/nvidia*
两张显卡显示正常;
4. 重装nvidia驱动,问题未解决;
5.echo出现差别
可以看出第一张卡没法读写,第二张卡可以写(nvidia-smi显示的也是第二张卡);
6. 测试
拔掉第二张显卡,测试第一张显卡,开机后进不了图形界面,nvidia-smi也没有显示显卡信息,基本确定显卡硬件故障,直接电话送修。
结论:还是建议买公版的显卡。