问题描述
实验室配了一台新电脑,主机是dell precision 4660 tower,显卡 4090d,安装Ubuntu 20/22系统(先装的20,后来升级到22)。
到手之后,出现频繁宕机的问题。每次使用一段时间(约12小时)之后就会突然宕机,表现为屏幕卡死无法操作(图形界面和tty都无法操作),ssh也无法连接,所有进程都死了。而且宕机期间发现显卡仍然运转,散发热量。
查了系统日志,没有发现明显错误,有一些内核报错,硬盘报错等日志,尝试解决,无果。在网上找了很多资料都不能解决宕机问题。
解决方法
升级BIOS。戴尔在前几天发布了一个BIOS更新,重要性为紧急,明确写出添加了对戴尔 Precision 固定工作站系统中 NVIDIA RTX 4090 D 显卡的支持。更新完这个问题基本就解决了。
BIOS地址:
https://www.dell.com/support/home/zh-cn/drivers/driversdetails?driverid=mhh07&oscode=ubt22&productcode=precision-3660-workstation