Linux下检测N卡(英伟达)设备的内存频率命令:
nvidia-smi -a -q -d CLOCK | fgrep -A 3 “Max Clocks” | fgrep “Memory”
当内存频率为1Hz时,时钟周期为1s
因此,将带宽从每秒千兆字节数转换为每周期千兆字节数的公式为:
吞吐量(GB/s)/内存频率(GHz)
用内存延迟 × 每周期字节数 可以得到内存操作所需并行
Linux下检测N卡(英伟达)设备的内存频率命令:
nvidia-smi -a -q -d CLOCK | fgrep -A 3 “Max Clocks” | fgrep “Memory”
当内存频率为1Hz时,时钟周期为1s
因此,将带宽从每秒千兆字节数转换为每周期千兆字节数的公式为:
吞吐量(GB/s)/内存频率(GHz)
用内存延迟 × 每周期字节数 可以得到内存操作所需并行