GPU 加速深度学习,剖析深度神经网络
NVIDIA
一
nvidia-smi
功耗是 GPU 利用率的另一个重要指标。通常,启动的 CUDA 或 Tensor 核心越多,消耗的 GPU 功率越高。
GPU-Util显示利用率
深度学习领域中提高 GPU 利用率最常使用的优化技术—几乎占用所有 GPU 内存的批次大小
二
nvidia-smi dmon
以滚动方式列出更多的 GPU 统计数据
每一个 GPU 都有多个串流多处理器(streaming multiprocessors),执行 CUDA 核心。
nvidia-smi dmon 会列出下列统计资料:
串流多处理器(streaming multiprocessors)
功耗(pwr)
GPU 温度(gtemp)
记忆体温度(mtemp)
内存利用率(mem)
编码器利用率(enc)
译码器利用率(dec)
内存时钟速率(mclk)
处理器时钟速率(pclk)
三
有多个 GPU 时,可以利用的另一个工具
nvidia-topo -m
显示出 GPU 装置的拓扑以及彼此连接的方式