1.需求 监控深度学习平台的运行情况 2.方法 watch -n 1 nvidia-smi 3.影响因素 Volatile GPU util 调节batchsize和num_workers,使得该数值尽量达到100%Memory-Usage 使得GPU内存尽量占满