Tesla系列GPU默认开启了ECC(error correcting code, 错误检查和纠正)功能,该功能可以提高数据的正确性,随之而来的是可用内存的减少和性能上的损失。
通过命令 nvidia-smi可以看到设备上所有GPU的信息参数,也可以用命令 nvidia-smi -i n (n代表GPU在设备下的编号,如:0,1,2等)可查看指定GPU的信息参数(详细信息可通过 nvidia-smi -q -i n获取),其中有一项是volatile Uncorr. ECC, 可通过该选项查看当前ECC配置。
通过 nvidia-smi -i n -e 0/1 可关闭(0)/开启(1)第n号GPU的ECC模式,重启后该设置生效。
通过实践,关闭ECC程序的性能能得到13%~15%的提升。
sudo nvidia-smi -pm 1 :修改Gpu memnory 的缓存不清除,以便提高下次的加载速度。
sudo nvidia-smi -c 3 :修改成单卡单任务线程模式。