1.关于nvidia驱动
问题1:由于安装不合适的nvidia驱动,可能会导致安装好的系统进不去,卡在开机界面。
解决:在开机选择系统界面,选择第二个ubuntu高级选项,选择带有recovery的选项,选择root,在最下面的命令行输入命令删除nvidia驱动:
sudo apt-get remove --purge nvidia*
之后重启即可:
sudo reboot
问题2:安装推荐的驱动也会出现上面的问题
解决:因为Ubuntu20.04 gcc版本是9,而nvidia驱动不支持gcc-9,因此需要手动安装gcc-7
sudo apt-get install gcc-7 g++-7
设置默认的gcc与g++为7
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 2
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 1
sudo update-alternatives --display gcc
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-7 2
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-9 1
sudo update-alternatives --display g++
再重装nvidia驱动即可。
2.深度学习环境安装
2.1.cuda安装
1.版本选择:首先通过nvidia-smi查看允许安装的最高版本
我的允许安装的最高版本为12.2 ,此时不要着急直接安装cuda12.2,再看pytorch支持的版本、zed2相机sdk支持版本,然后再安装。
比如:
pytorch支持的版本并没有cuda12.2,因此需要安装cuda12.1。
我下载的zed sdk支持cuda12.1,因此安装cuda12.1。
2.安装过程:按照nvidia cuda官网的操作流程来就是。
由于我已经安装好了,该图为网络图。注意一定要勾选掉driver,因为之前就已经安装好了。
3.安装之后,配置环境变量:
终端打开
sudo gedit ~/.bashrc
在.bashrc最后添加
export PATH=/usr/local/cuda-12.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
更新配置
source ~/.bashrc
2.2.cudnn pytorch安装
他们的安装都很简单,选择正确版本后直接按照官网流程即可。
安装pytorch之后进行测试是否可以调用gpu:
终端打开,进入python
python3
导入pytorch
import torch
测试
if torch.cuda.is_available():
device = torch.device("cuda")
print("PyTorch is using GPU")
else:
device = torch.device("cpu")
print("PyTorch is using CPU")
3.使用源码,有时通过src文件夹解决依赖问题
错误:运行类似的代码(我看到很多写法,不太懂有什么区别)如下,出现错误
rosdep install --from-paths src --ignore-src --rosdistro=melodic
解决办法:
rosdep update --include-eol-distros
4.安装依赖时,有未满足的依赖关系
错误:
解决办法:按照显示的错误安装依赖
比如上图错误,就sudo apt-get install libvtk7-java,如果还是有错误,就接着安装需要的依赖。