一、问题
Dell台式机。
1. gcc版本不匹配
我是采用tty模式运行.run文件安装的。遵循该文章流程
ubuntu 20.04安装Nvidia驱动/CUDA/pytorch-GPU的手把手保姆级别教程
第一步出错,观察log文件发现是gcc版本落后。ubuntu22.04采用gcc12编译,而默认安装的gcc11。按照如下文章解决:
注意具体的gcc版本选择要看/var/log/里生成的log文件来判断。
2. 如下问题选择了YES导致重启无法进入UBUNTU
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择 Yes
在上述知乎文章的流程中他说选择yes,但结合个人经验来看应该选择NO。否则将会遇到重启后卡在ubuntu启动logo界面。如果不慎选择了yes,可以参考如下补救方式:
Ubuntu20.04安装完NVIDIA驱动后重启黑屏,无法进入图形桌面的可能解决方法_ubuntu 20.04 安装显卡驱动开机黑屏-CSDN博客
我选择了方法二:
首先进入救援模式,然后输入
cd /etc/X11/
ls grep | xorg
会发现有xorg.conf,xorg.cong-nvidia-xconfig这两个文件,后者的文件后缀可能有细微差别。
xorg.conf是驱动安装过程中被修改过的(选择Yes的后果),修改了系统的X服务器配置文件/etc/X11/xorg.conf,来让X服务器自动指向NVIDIA X来作为图形驱动。xorg.cong-nvidia-xconfig是备份的原文件。解决办法是,只需要删除修改过的xorg.conf,并将xorg.cong-nvidia-xconfig重命名为xorg.conf,重启即可。
如果因为各种原因无法进入救援模式,首先要确定自己电脑如何进入gnu grub。然后参考这个文章:
3. 显卡没有正常发挥作用
安装显卡驱动后出现了如下抽象的现象
- 神经网络可以利用显卡正常推理,训练
- 设置-关于中系统的显卡信息仍然是集成显卡
- nvidia-settings中无法切换显卡
- 执行如下命令
glxinfo | grep OpenGL
得到结果为OpenGL renderer string: llvmpipe (LLVM 15.0.7, 256 bits)
这导致我的ros gui,webots,gazebo等3D 界面出现严重卡顿。
综上有必要重装显卡驱动,我推测是因为上次安装带上了-no-opengl-files的原因。这次安装就不加这个选项了。
重新安装后,现象2解决。
但是现象4出现了抽象的结果:
我执行glxinfo | grep OpenGL,得到结果OpenGL renderer string: Mesa Intel(R) Graphics (RKL GT1),依然不是nvidia的显卡。运行3D画面时调用nvida-smi可以看到显卡并没有在工作,但是3D界面的卡顿问题得到解决。
虽然深层问题没有解决,但是表层问题已经解决了,因此我打算直接使用该环境进行开发了。继续钻研可能会无功而返并且完全摧毁现在构建的系统环境。这次经历让我深刻理解到了什么是fuck nvidia。