检查tnesorcore的使用

使用以下步骤来使用 nsysnvprof 命令来检查您的程序是否正在使用 Tensor Cores:

  1. 确保您的GPU支持Tensor Cores。只有Pascal架构之后的NVIDIA GPU才支持Tensor Cores。您可以在 NVIDIA 官方文档中查看您的GPU是否支持Tensor Cores。

  2. 启动您的CUDA应用程序,并通过以下命令获取其PID(进程ID):

     

    phpCopy code

    $ pgrep <your_application_name>

  3. 使用 nsys 命令来运行您的CUDA应用程序,并捕获它的性能数据。您可以使用以下命令来运行 nsys

     

    rubyCopy code

    $ nsys profile --stats=true -o <output_file_name> -f true -t cuda,nvtx <your_application_name>

    这将生成一个名为 <output_file_name> 的输出文件,其中包含有关应用程序性能的详细信息。

  4. 分析 nsys 的输出文件以确定您的程序是否正在使用Tensor Cores。在输出文件中,您可以查看CUDA核心统计信息,并查找与Tensor Cores有关的统计信息。具体来说,您可以查找以下统计信息:

    • sm__sass_thread_inst_executed_op_fma_pred_on.sum:执行的预测计算的FMAs总
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值