今天编译了个算矩阵相乘的程序,想用nvprof工具来分析kernel的运行状况。
输入nvprof ./matrix.out
结果报错======== Error: unified memory profiling failed.
改为
nvprof --unified-memory-profiling off ./matrix.out
成功!
今天编译了个算矩阵相乘的程序,想用nvprof工具来分析kernel的运行状况。
输入nvprof ./matrix.out
结果报错======== Error: unified memory profiling failed.
改为
nvprof --unified-memory-profiling off ./matrix.out
成功!