torch.backends.cudnn.benchmark = true的作用

jingbo1801

已于 2022-10-22 16:16:58 修改

阅读量1.2w

点赞数 22

分类专栏：未分类文章标签： pytorch 机器学习 benchmark cudnn

于 2020-08-11 23:30:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34910922/article/details/107947125

版权

未分类专栏收录该内容

121 篇文章 22 订阅

订阅专栏

在很多情况下我们都能看到代码里有这样一行：

torch.backends.cudnn.benchmark = true

大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

一般来讲，应该遵循以下准则：

如果网络的输入数据维度或类型上变化不大，设置 torch.backends.cudnn.benchmark = true

可以增加运行效率；

如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

cuDNN使用非确定性算法，并且可以使用torch.backends.cudnn.enabled = False来进行禁用。如果设置为torch.backends.cudnn.enabled =True，说明设置为使用非确定性算法。

所以我们经常看见在代码开始出两者同时设置：

torch.backends.cudnn.enabled = True
torch.backends.cudnn.benchmark = True

补充知识：

cuDNN 是英伟达专门为深度神经网络所开发出来的 GPU 加速库，针对卷积、池化等等常见操作做了非常多的底层优化，比一般的 GPU 程序要快很多。在使用 cuDNN 的时候，torch.backends.cudnn.benchmark 模式是为 False。哪些因素会影响到卷积层的运行时间：

1、首先，当然是卷积层本身的参数，常见的包括卷积核大小，stride，dilation，padding ，输出通道的个数等；

2、其次，是输入的相关参数，包括输入的宽和高，输入通道的个数等；

3、最后，还有一些其他的因素，比如硬件平台，输入输出精度、布局等等。

设置 torch.backends.cudnn.benchmark=True 将会让程序在开始时花费一点额外时间，为整个网络的每个卷积层搜索最适合它的卷积实现算法，进而实现网络的加速。适用场景是网络结构固定（不是动态变化的），网络的输入形状（包括 batch size，图片大小，输入的通道）是不变的，其实也就是一般情况下都比较适用。反之，如果卷积层的设置一直变化，将会导致程序不停地做优化，反而会耗费更多的时间。

参考文章：

1、代码torch.backends.cudnn.benchmark = true的作用及意义_小小酥在江湖的博客-CSDN博客

2、https://www.jb51.net/article/180900.htm

3、torch.backends.cudnn.benchmark ?! - 知乎

关注

22
点赞
踩
81

收藏

觉得还不错? 一键收藏
打赏
0
评论
torch.backends.cudnn.benchmark = true的作用

在很多情况下我们都能看到代码里有这样一行：torch.backends.cudnn.benchmark = true大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。一般来讲，应该遵循以下准则：如果网络的输入数据维度或类型上变化不大，设置torch.backends.cudnn.benchmark = true可以增加运行效率；如果网络的输入数据在每次 iteration 都变化的话，会.
复制链接

扫一扫

专栏目录

jingbo1801

CSDN认证博客专家 CSDN认证企业博客

码龄8年

人工智能领域优质创作者

449: 原创

2138: 周排名

5604: 总排名

161万+: 访问

: 等级

9155: 积分

3万+: 粉丝

1425: 获赞

410: 评论

7305: 收藏

私信

关注

热门文章

分类专栏

目录索引 3篇
python 67篇
c++ 39篇
ubuntu/tx2 68篇
图像处理 22篇
深度学习 21篇
分类网络 28篇
目标检测 23篇
mmclassification 13篇
mmsegment 10篇
deepstream 15篇
开发工具 44篇
未分类 121篇
算法部署 7篇
可视化 15篇
detectron2 9篇
随笔 2篇

最新评论

libtorch c++部署-使用GPU
weixin_46477577: 太牛了！解决了！
mmsegment数据集说明（六）
风若剑: 和concat dataset搭配使用吧，一个重要程度高的dataset重复多次，再和base dataset concat在一起训
python读取tif图像+经纬度
Yanshil.: 那这个得到的只是投影坐标呀不是经纬度把。。
mmsegment数据集说明（六）
一直都是菜鸟: 您好，我想咨询一下，repetat dataset有什么特别的用处么。即使不使用repeat，不也是将数据集重复训练么
Ubuntu桌面不见了，桌面找回
weixin_42914339: 我遇到的情况是 Ubuntu16 找不到unity导致，重新安装了unity后，运行报了python相关的错。之前是靠其他方法安装了高版本的python3.9。把3.9卸载，然后python重定向v2.7，python3重定向v3.5就可以了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

jingbo1801 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。