PyTorch 1.0 中文文档：torch.utils.bottleneck

最新推荐文章于 2024-04-09 19:57:22 发布

weixin_30892037

最新推荐文章于 2024-04-09 19:57:22 发布

阅读量469

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/wizardforcel/p/10492596.html

版权

本文详细介绍了PyTorch 1.0 中的torch.utils.bottleneck模块，该模块是调试性能瓶颈的关键工具。内容涉及如何在命令行使用该工具进行脚本分析，特别提醒了在CUDA环境下分析时可能存在的计时误差，并提供了选择分析模式的依据。同时，文章提到了NVTX的使用和其可能带来的高开销问题。对于需要深入理解PyTorch性能分析的读者，提供了进一步的参考资料链接。

摘要由CSDN通过智能技术生成

译者: belonHan

torch.utils.bottleneck是调试瓶颈bottleneck时首先用到的工具.它总结了python分析工具与PyTorch自动梯度分析工具在脚本运行中情况.

在命令行运行如下命令

python -m torch.utils.bottleneck /path/to/source/script.py [args]

其中 [args] 是script.py脚本的参数(任意个数).运行python -m torch.utils.bottleneck -h命令获取更多帮助说明.

警告

请确保脚本在分析时能够在有限时间内退出.

警告

当运行CUDA代码时，由于CUDA内核的异步特性, cProfile的输出和cpu模式的autograd分析工具可能无法显示正确的计时: 报告的CPU时间是用于启动内核的时间,不包括在GPU上执行的时间。在常规cpu模式分析器下，同步操作是非常昂贵的。在这种无法准确计时的情况下，可以使用cuda模式的autograd分析工具。

注意

选择查看哪个分析工具的输出结果(CPU模式还是CUDA模式) ,首先应确定脚本是不是CPU密集型CPU-bound(“CPU总时间远大于CUDA总时间”)。如果是cpu密集型，选择查看cpu模式的结果。相反，如果大部分时间都运行在GPU上，再查看CUDA分析结果中相应的CUDA操作。

当然

最低0.47元/天解锁文章

weixin_30892037

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch 1.0 中文文档：torch.utils.bottleneck

译者: belonHantorch.utils.bottleneck是调试瓶颈bottleneck时首先用到的工具.它总结了python分析工具与PyTorch自动梯度分析工具在脚本运行中情况.在命令行运行如下命令python -m torch.utils.bottleneck /path/to/source/script.py [args]其中 [args] 是script.py...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。