【Pytorch】torch.backends.cudnn.deterministic与 torch.backends.cudnn.benchmark

最新推荐文章于 2024-08-15 16:43:28 发布

苍白的小包叽

最新推荐文章于 2024-08-15 16:43:28 发布

阅读量2.9k

点赞数 1

文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/qq_36791000/article/details/121786560

版权

DynamicSparseTraining/train.py at master · junjieliu2910/DynamicSparseTraining · GitHubhttps://hub.xn--gzu630h.xn--kpry57d/junjieliu2910/DynamicSparseTraining/blob/master/cifar/train.py讲的很清楚，这里记点个人觉得有用的笔记

设置 torch.backends.cudnn.benchmark=True 将会让程序在开始时花费一点额外时间，为整个网络的每个卷积层搜索最适合它的卷积实现算法，进而实现网络的加速。适用场景是网络结构固定（不是动态变化的），网络的输入形状（包括 batch size，图片大小，输入的通道）是不变的，其实也就是一般情况下都比较适用。反之，如果卷积层的设置一直变化，将会导致程序不停地做优化，反而会耗费更多的时间。

torch.backends.cudnn.deterministic是啥？顾名思义，将这个 flag 置为True的话，每次返回的卷积算法将是确定的，即默认算法。

cudnn中包含很多卷积算法。基于 GEMM (General Matrix Multiply) 的，基于 FFT 的，基于 Winograd 算法的等等。

cudnn中卷积算法：

static const algo_t algos[] = {
         CUDNN_CONVOLUTION_FWD_ALGO_GEMM,
         CUDNN_CONVOLUTION_FWD_ALGO_FFT,
         CUDNN_CONVOLUTION_FWD_ALGO_FFT_TILING,
         CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM,
         CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM,#默认
         CUDNN_CONVOLUTION_FWD_ALGO_DIRECT,
         CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD,
         CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD_NONFUSED,
    };
#代码网址：
#https://github.com/pytorch/pytorch/blob/b5fa9a340a0d174131ad0a452c395860d571b5b0/aten/src/#ATen/native/cudnn/Conv.cpp#L504