Nvidia nsight 性能分析工具

在这里插入图片描述

nsight system

nsys profile --stats=true -o txt2image  --force-overwrite=true --trace=cuda,cudnn,cublas,osrt,nvtx,opengl python3 demo_txt2img.py "a beautiful photograph of Mt. Fuji during cherry blossom" --version 2.0-base  >txt2image.log
# 其中
-t 后面跟定的参数是我们要追踪的API,即需要CUDA API,OS runtime API以及NVTX API
-o 给定的是输出的文件名称
-w 后面表明是或否要在命令行中同时输出结果python main.py为程序的执行命令

# 生成3个文件
-rw-rw-r--  1 root root 25232169 Sep  7 03:12 txt2image.nsys-rep
-rw-rw-r--  1 root root  2550258 Sep  4 02:27 txt2image.qdstrm
-rw-r--r--  1 root root 76693504 Sep  7 03:13 txt2image.sqlite

在这里插入图片描述
在这里插入图片描述

nvtx 使用

在这里插入图片描述

Nsight Compute

basic operation

  • replay mode
  • section

Metrics

在这里插入图片描述

Key feature

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • LSU 代表load/store,占比过高说明流水线设计有问题,需要减少

schedule analysis

在这里插入图片描述
在这里插入图片描述

Memory Analysis

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考资料

  • https://cloud.baidu.com/doc/GPU/s/el8mizux4
  • 用户手册:
    • https://zhuanlan.zhihu.com/p/279424529
    • https://zhuanlan.zhihu.com/p/279471116
    • https://zhuanlan.zhihu.com/p/279492185
    • https://zhuanlan.zhihu.com/p/463844048
    • https://zhuanlan.zhihu.com/p/577412348
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值