在ubuntu下配置nvidia驱动真的是坑比较多,稍微记录一下备用。
想要cuda跑起来,需要pytorch,cuda,版本能对上,这个是整个安装过程的核心。我第一次安装失败就是cuda版本不对应,导致虽然能查到cuda,但是算法没有再gpu上跑,运行起来还是比较慢。
安装过程主要看这2篇文章:
https://blog.csdn.net/takedachia/article/details/130375718
Ubuntu22.04安装CUDA、cudnn详细步骤_ubuntu安装cudnn_takedachia的博客-CSDN博客
如果是一个干净的系统,这样装应该问题不大。而且巧的是,我选的版本跟他完全一致。
各位想变通的,首先要查一下你想安装的cuda版本pytorch是否支持,我上来装了一个cuda11.5,发现pytorch不支持,所以又全部重新删掉之后再装的。
全部搞完之后,
但是我输入nvidia-smi的时候报了一个错:
Failed to initialize NVML: Driver/library version mismatch
这时候看这篇文章,说应该还是装了多个驱动。
其实在这之前我已经重复安装多次了,我感觉我装的应该是对的,但是我在运行
cat /proc/driver/nvidia/version
的时候说我装的是515驱动。我从来没装过515驱动,估计是装cuda的时候带进去的,因为装cuda的时候提示过安装515驱动,但是这时候我没有完全重装,就把电脑重启了一下,就好了。
所以各位把驱动,cuda,cudnn装好之后,可以重启一下电脑试试,可能是环境没有完全更改过来。
其他链接:
后记:
yolo gpu ubuntu的系统延迟真的是很奇怪。
我的项目是用一个UVC camera进入yolo进行识别,在Ubuntu22 和ubuntu18下测试发现,整个系统相对于win有400ms的整体延迟。注意不是计算时间长400ms,而是从输入到输出(在屏幕上显示)会多400ms,这对于我的项目来说是不能接受的。代码是python的,直接拷过来测试的。
测试方法就是用摄像头拍秒表,再用手机拍秒表(真实时间)和yolo输出画面上显示的时间,这是测试视频延迟的常用方法。
测试过用uvc采集的图像直接显示,(不过yolo)没有延迟,因此感觉延迟就是yolo里面带来的。
但是同样的代码在win下就没有。我是在同样的电脑上直接换硬盘测试的,因此硬件也是完全一样的。
有遇到类似问题的朋友可以一起讨论一下。
弃坑换win了,唉。。。