问题描述:服务器(ubuntu18.04)加装了4个2080ti,风扇狂转,噪音莫名的大。用iDRAC看了下,空载情况风扇的功率都达到了66%,吹的全是冷风。想想肯定不对劲啊。
问题分析:查了很多文章,发现问题是由于2080ti并不是官方认证的显卡型号,所以导致服务器识别错误,无法根据GPU温度自动调节风扇转速造成的。官方认证的型号如下图(但现在应该可以支持更多了,更新BIOS和iDRAC之后):
问题解决:
(总结了很多篇文章,以及联系dell 在线技术支持(公众号名字:戴尔中国服务)得到的综合解决方式,参考文章见文末。实在还有问题可以评论或者在工作日联系戴尔技术支持)way1 使用racadm 调控
way2 更新BIOS 和iDrac
1.安装dell 的 racadm(我这里服务器系统是ubuntu18.04 LTS)。T640 貌似对应的是14G(代),去官网下载适配的racadm版本(我这里是 racadm 9.3.0)
针对ubuntu,需要用这个网站的方法安装racadm。How to install Dell OpenManage 9.x and racadm on Ubuntu 16.04www.claudiokuenzler.com
2.
首先,获取所有PCI接口的信息
racadm get System.PCIESlotLFM // List all available PCI slots