torch.backends.cudnn.benchmark和torch.backends.cudnn.deterministic解读

最新推荐文章于 2024-08-19 23:23:47 发布

边豪

最新推荐文章于 2024-08-19 23:23:47 发布

阅读量4.1k

点赞数 17

分类专栏： pytorch日常积累深度学习文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/qq_40612314/article/details/114385936

版权

深度学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

pytorch日常积累

3 篇文章 0 订阅

订阅专栏

torch.backends.cudnn.benchmark

简介：总的来说，大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。
一般来讲，应该遵循以下准则：
如果网络的输入数据维度（包括 batch size，图片大小，输入的通道）或类型上变化不大，设置 torch.backends.cudnn.benchmark = true 可以增加运行效率；
如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

torch.backends.cudnn.deterministic

torch.backends.cudnn.deterministic=True

将这个 flag 置为True的话，每次返回的卷积算法将是确定的，即默认算法。
如果配合上设置 Torch 的随机种子为固定值的话，应该可以保证每次运行网络的时候相同输入的输出是固定的。

args.seed = 2021
random.seed(args.seed)
np.random.seed(args.seed)
torch.manual_seed(args.seed)
torch.cuda.manual_seed(args.seed)
torch.backends.cudnn.deterministic=True