1、关闭irq,并设置开机不启动
systemctl stop irqbalance.service
systemctl disable irqbalance.service
2、设置看门狗时间
echo 30 >/proc/sys/kernel/watchdog_thresh
3、驱动拉黑nouveau和GSP
- 拉黑nouveau
echo -e
'blacklist nouveau \noptions nouveau modeset=0\n'>/etc/modprobe.d/blacklist.conf
- 拉黑GSP
echo 'options nvidia NVreg_EnableGpuFirmware=0' > /etc/modprobe.d/nvidia-gsp.conf
4、GPU卡状态开启持久模式
nvidia-smi -pm 1 (当服务器上安装gpu卡大于等于4张,需要开启持久模式,单次生效,重启失效,建议加入到开机启动项rc.local中)
5、操作系统建议优化设置
可以在BIOS下或者系统下设置CPU状态,BIOS和系统下二选一即可。
服务器BIOS配置
BIOS→Socket Configuration→Processor Configuration→Hyper-Threading----Disable
BIOS→Socket Configuration→Processo