GPU设置

GPU降温测试

前提

同一个训练程序,使用8块GPU,GPU使用率基本全程>90%,GPU为1080 Ti

限制最高功率效果

不限制最高功率(默认最高功率250W):最高温度85°,大多时间在75°-85°之间
将最高功率限制为150W:最高温度81°,大多时间在70°-81°之间
将最高功率限制为125W:最高温度77°,大多时间在61-77°之间
限制功率对性能的影响暂时细致测试,从训练时间上看,稍有下降(5个batch的训练耗时从15秒增加到17秒),看上去影响不大
以上测试时,风扇转速大约维持在45%

提高风扇转速

提高风扇转速降温很明显,由于修改风扇转速脚本还不完善,暂时没有测试很完整

功率限制

手动设置GPU卡设备的状态选项:nvidia-smi –pm 0/1,设置持久模式:0/DISABLED,1/ENABLED
功率限制信息查询: nvidia-smi -q -d POWER
功率限制设定:nvidia-smi -pl 150, 最大功率设置为150
针对某张卡设置功率:nvidia-smi -i 1 -pl 150, 将第1张卡的最大功率设置为150
docker内部限定功率:需要在启动容器时加入–cap-add=SYS_ADMIN
See: https://docs.docker.com/engine/security/security/#linux-kernel-capabilities

在这里插入图片描述
在这里插入图片描述

风扇转速设置

nvidia-settings -a ‘[gpu:0]/GPUFanControlState=1’ -a ‘[fan:0]/GPUTargetFanSpeed=60’ 无法直接在没有X server的服务器上直接运行
解决方法:https://github.com/boris-dimitrov/set_gpu_fans_public

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值