cudnn.benchmark和cudnn.deterministic

最新推荐文章于 2024-09-06 14:16:56 发布

坚硬果壳_

最新推荐文章于 2024-09-06 14:16:56 发布

阅读量1.6k

点赞数 1

分类专栏： pytorch学习笔记

原文链接：https://www.pytorchtutorial.com/when-should-we-set-cudnn-benchmark-to-true/

版权

pytorch学习笔记专栏收录该内容

32 篇文章 15 订阅

订阅专栏

问题

在很多情况下我们都能看到代码里有这样一行：

torch.backends.cudnn.benchmark = true

1	torch.backends.cudnn.benchmark = true

而且大家都说这样可以增加程序的运行效率。那到底有没有这样的效果，或者什么情况下应该这样做呢？

解决办法

总的来说，大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

一般来讲，应该遵循以下准则：

如果网络的输入数据维度或类型上变化不大，设置 torch.backends.cudnn.benchmark = true 可以增加运行效率；
如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

这下就清晰明了很多了。

坚硬果壳_ CSDN认证博客专家 CSDN认证企业博客

码龄8年

117: 原创

4万+: 周排名

2万+: 总排名

41万+: 访问

: 等级

2564: 积分

135: 粉丝

368: 获赞

60: 评论

1559: 收藏

私信

关注

热门文章

分类专栏

最新评论

PyTorch基础教程学习笔记（八）：训练一个分类器
翼同: --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) ~\AppData\Local\Temp/ipykernel_24024/3057148826.py in <module> 15 # get some random training images 16 dataiter = iter(trainloader) ---> 17 images, labels = dataiter.next() 18 19 # show images AttributeError: '_SingleProcessDataLoaderIter' object has no attribute 'next'
pytorch之多GPU使用——#CUDA_VISIBLE_DEVICES使用 #torch.nn.DataParallel() #报错解决
坚硬果壳_: 是的，文中是针对Ubuntu系统
pytorch之多GPU使用——#CUDA_VISIBLE_DEVICES使用 #torch.nn.DataParallel() #报错解决
饿了就干饭: 我最近尝试在win10平台上使用多卡进行对大模型进行推理，文中这个方法应该是只能在linux系统使用吧，多GPU进行模型推理时，需要NCCL辅助多GPU之间进行通信，而英伟达只发布了linux版本的NCCL包~ NCCL下载地址：https://developer.nvidia.com/nccl/nccl-legacy-downloads可以验证
【已解决】.pth---＞.onnx(---＞.tflite)---＞.kmodel
xsj233: 你好，请问pip install安装好nncase之后怎么用这个来转换kmodel呢？
_pickle.UnpicklingError: unpickling stack underflow
2201_75732845: 怎么在windows里面找那个位置啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。