随机数种子cudnn.benchmark与cudnn.deterministic

蓝狸妖皇

已于 2023-12-02 20:39:12 修改

阅读量816

点赞数 6

CC 4.0 BY-SA版权

文章标签：深度学习

于 2023-12-02 20:12:01 首次发布

本文链接：https://blog.csdn.net/ctrldelete/article/details/134756910

文章介绍了如何在PyTorch中通过torch.backends.cudnn.benchmark和torch.backends.cudnn.deterministic设置来控制卷积运算的性能和复现性。通常，benchmark用于提升网络速度，而deterministic则保证结果的一致性，适用于模型复现或需要精确结果的情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

设置 torch.backends.cudnn.benchmark=True 将会让程序在开始时花费一点额外时间，为整个网络的每个卷积层搜索最适合它的卷积实现算法，进而实现网络的加速。适用场景是网络结构固定（不是动态变化的），网络的输入形状（包括 batch size，图片大小，输入的通道）是不变的，其实也就是一般情况下都比较适用。反之，如果卷积层的设置一直变化，将会导致程序不停地做优化，反而会耗费更多的时间。

torch.backends.cudnn.deterministic = True ，每次返回的卷积算法将是确定的。可以避免benchmark=True的差异。
某些操作（如卷积）在实现上使用了随机性，它们可能会引入一些随机性的元素，例如权重初始化、Dropout等。

如果是复现模型结果的话，应该用这个配置（李宏毅hw1）

def same_seed(seed):
    
    '''Fixes random number generator seeds for reproducibility'''
    # 使用确定性算法(deterministic algorithms)，以确保相同的input，parameters和环境可以输出相同的output，使得训练结果可以复现。
    torch.backends.cudnn.deterministics=True
    # 由于使用GPU进行训练时，cuDNN会自动选择最高效的算法，导致训练结果难以复现，因此需要关闭benchmark模式。
    torch.backends.cudnn.benchmark=False
    
    #random.seed(seed)
    np.random.seed(seed)   # 根据输入的seed设置固定的numpy seed。
    torch.manual_seed(seed)   # 根据输入的seed值在torch中设置固定的起始参数。
    
    if torch.cuda.is_available():
        torch.cuda.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)# if you are using multi-GPU.

总之，方便复现、提升训练速度就：