https://www.jianshu.com/p/ab956df5e40c
原始知乎文章:https://zhuanlan.zhihu.com/p/27682206?utm_medium=social&utm_source=wechat_session
几乎是遇到与知乎张三同样的问题
1. 买带水冷的GPU
但是控温效果不好,下图是平时状态。
问题是在进行训练的时候
GPU-util使用率100,
memory-Usage是4000MiB.
风扇百分之49,温度86!!!2. 调节GPU风扇
我注意到Nvidia自动调节风扇的方式很奇怪: GPU温度达到85度左右的时候, 风扇却只运行在50%的速度. 在网上搜索了很多更改GPU风扇的方法, 尝试很久后终于成功, 下面是具体步骤.
显示显卡状态:
$ watch -n 1 nvidia-smi
1 修改/etc/X11/xorg.conf文件
sudo nano /etc/X11/xorg.conf
2 如果不能打开文件xorg.conf
使用终端指令:$ chomd a+w xorg.conf
3 在Section "Device"里面加入 Option "Coolbits" "4"
其实就是加入了这一行
Option "Coolbits" "4"
Section "Device"
Identifier "Device0"
Driver "nvidia"
VendorName "NVIDIA"
Option "Coolbits" "4"
EndSection
4 输入如下指令控制风扇速度:
$ nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUTargetFanSpeed=100"
尽量别写100,风扇会狂转,写个60试一试
加上风扇85之后温度降到了71C!!!

5 恢复到最初的自动控制风扇转速的状态
$ nvidia-settings -a "[gpu:0]/GPUFanControlState=0"