结果不能复现的原因 GPU cudnn cudnn.benchmark = True

pythonSuperman

已于 2024-07-11 09:54:45 修改

阅读量265

点赞数 1

分类专栏：深度学习调试安装文章标签：深度学习人工智能神经网络

于 2024-05-27 09:32:56 首次发布

本文链接：https://blog.csdn.net/llf000000/article/details/139226873

版权

调试安装同时被 2 个专栏收录

59 篇文章 1 订阅

订阅专栏

深度学习

54 篇文章 3 订阅

订阅专栏

GPU的使用

在定义模型时，如果没有特定的GPU设置，会使用 torch.nn.DataParallel 将模型并行化，充分利用多GPU的性能，这在加速训练上有显著影响。这段代码设置后，仍然可以复现。

model = torch.nn.DataParallel(model).cuda()

第一种不使用cudnn 的配置来复现结果：

为了确保实验结果的完全可复现性，通常需要关闭cudnn.benchmark 并设置 cudnn.deterministic 为 True。具体来说，可以使用以下设置：

cudnn.benchmark = True

应该设置为：

import torch
import torch.backends.cudnn as cudnn

cudnn.benchmark = False
cudnn.deterministic = True

input, target = input.to(args.device), target.to(args.device)

缺点：

加了之后论文不能复现

第二种使用cudnn的配置来复现结果

    os.environ['CUDA_VISIBLE_DEVICES'] = args.gpu
    cudnn.benchmark = True

input, target = input.cuda(), target.cuda()

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pythonSuperman

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
结果不能复现的原因 GPU cudnn cudnn.benchmark = True

在定义模型时，如果没有特定的GPU设置，会使用将模型并行化，充分利用多GPU的性能，这在加速训练上有显著影响。
复制链接

扫一扫

专栏目录

tf+gpu无法复现

ningyanggege的博客

06-12

413

如图所示： tf无法完全复现一样的结果，其随机性来源于gpu使用cudn

随机数种子cudnn.benchmark与cudnn.deterministic

ctrldelete的博客

12-02

626

torch.backends.cudnn.benchmark = True可以提升训练速度。会让程序在开始时花费一点额外时间，为整个网络的每个卷积层搜索最适合它的卷积实现算法，进而实现网络的加速。但是由于计算中有随机性，每次的网络结果可能会略有差异。torch.backends.cudnn.deterministic = True 固定cuda的随机数种子，每次返回的卷积算法将是确定的。某些操作（如卷积）在实现上使用了随机性，它们可能会引入一些随机性的元素，例如权重初始化、Dropout等。

参与评论您还未登录，请先登录后发表或查看评论

pytorch模型可复现设置(cudnn.benchmark 加速卷积运算 & cudnn.deterministic)(随机种子seed)(torch.backends)

hxxjxw的博客

09-07

4981

在代码前加设torch.backends.cudnn.benchmark = True可以提升训练速度。会让程序在开始时花费一点额外时间，为整个网络的每个卷积层搜索最适合它的卷积实现算法，进而实现网络的加速。但是由于计算中有随机性，每次的网络结果可能会略有差异 torch.backends.cudnn.deterministic = True 固定cuda的随机数种子，每次返回的卷积算法将是确定的。可以避免benchmark=True的差异如果是复现模型结果的话，.........

torch.backends.cudnn.enabled = False会引起CUDA out of memory和CUDA error: an illegal memory access was

wzg2016的博客

10-20

7433

一般来说，题目所示这种问题都是由batch_size的设置引起的，修改batch_size之后就能有效解决。但是，我今天遇到一种情况，这个问题不是由batch_size引起的，而是由torch.backends.cudnn.enabled = False这个设置引起的。 torch.backends.cudnn.enabled = False这个设置主要用于实验过程的可复现，具体的实验过程可复现代码设置如下： import numpy as np import torc...

【Pytorch】中不可复现的问题

weixin_42419611的博客

05-12

1133

【Pytorch】中不可复现的问题最近遇到一个非常棘手的BUG，即使设定好了随机种子，但CNN模型，即包含Conv2d/Conv2d操作的模型不可复现。查阅资料,问题出在这，如果： cudnn.benchmark = True # if benchmark=True, deterministic will be False cudnn.deterministic = False cudnn.benchmark = True，该值默认为True，为True，cuDNN就会使用非确定性算法就会自动寻

Pytorch 深度学习结果无法复现的解决办法

weixin_45203752的博客

08-30

3997

pytorch 固定随机种子，复现模型结果

随机种子、torch.backends.cudnn.benchmark\.deterministic

M_arshal_的博客

10-24

3873

为什么使用相同的网络结构，跑出来的效果完全不同，用的学习率，迭代次数，batch size 都是一样？固定随机数种子是非常重要的。但是如果你使用的是PyTorch等框架，还要看一下框架的种子是否固定了。还有，如果你用了cuda，别忘了cuda的随机数种子。这里还需要用到torch.backends.cudnn.deterministic和torch.backends.cudnn.benchmark确保调度的卷积算法一致一、torch.backends.cudnn.deterministic是啥？ to

【深度强化学习】关于同一设备上cpu和gpu计算结果不一致问题

weixin_56760882的博客

05-24

1056

1、在一般使用中，可以不必追求cpu和gpu计算的结果一致性，也也避免不了，且cpu和gpu导致的细小差别，在训练的效果上几乎没有区别。2、同时，在同一台设备上，我们尽量要求该程序的结果能复现，是为了更好修改超参数。（见:本文万能seed，适用于单机多卡）3、不必追求在不同的设备上能复现一致结果，最终的效果在相同的超参数和输入下，输出的结果也相差无几。4、cpu和gpu在设计时的目的也不同，有差异理所应当，这里本文只分析了在计算上和训练神经网络时的出现的差异，仅作参考。

解决bert模型在gpu上实验结果的不可复现问题

hushaomoumou的博客

04-05

515

（3）原因在于：在将类别的token拼接文本token做为bert模型的输入时，涉及到使用set()的方式来过滤类别token的重复元素。由于set()是一种无序的不重复元素序列，因此每次在gpu运行代码时，过滤后的类别token中元素的顺序都不同(但在cpu上是相同的~不知为啥)，所以input_ids会发生变换。（1）在设置完第一步中的随机种子后，基本上可实现结果的可复现性。（2）后来通过检查发现，bert的输入input_ids每次不一样，因此得到的输出表征会不同，自然最终的实验结果也会不同。

浅谈pytorch torch.backends.cudnn设置作用

12-20

在这种情况下，可以考虑只启用CuDNN而不开启基准测试，即`torch.backends.cudnn.enabled = True`和`torch.backends.cudnn.benchmark = False`，以避免频繁的算法搜索。总之，理解和适当地调整`torch.backends....

cudnn v8.1.zip

04-11

CUDNN v8.1是NVIDIA公司推出的深度学习库，专为利用CUDA（Compute Unified Device Architecture）在GPU上加速深度神经网络（DNNs）的运算而设计。CUDA是NVIDIA开发的一种并行计算平台，它使得开发者能够利用GPU的...

浅谈PyTorch的可重复性问题(如何使实验结果可复现)

09-17

需要注意的是，尽管这些措施能显著降低结果的随机性，但完全的可复现性还受到其他因素的影响，比如硬件状态、操作系统调度等。因此，尽管尽可能遵循上述方法，仍可能存在微小的差异。在实际应用中，应根据具体需求...

cudnn-10.2-windows10-x64-v8.1.1.33.zip

07-01

NVIDIA提供了几个基准测试程序，例如`cudnn_benchmark`，可以用来检查CuDNN的功能和性能。 9. **最佳实践**: 使用CuDNN时，遵循一些最佳实践可以进一步提升性能，比如合理选择数据类型、利用批量大小、并行化处理等...

cudnn-7.5-linux-x64-v5.0-ga.tgz

06-30

CUDNN，全称为NVIDIA CUDA Deep Neural Network library，是由NVIDIA公司开发的一款深度学习库，主要用于加速基于GPU（Graphics Processing Unit）的深度神经网络（DNN）计算。CUDNN v5.0是该库的一个重要版本，针对...

16现代循环神经网络—深度循环与双向循环

kaszxc的博客

07-22

476

深度循环神经网络使用多个隐藏层来获得更多的非线性性GRU、RNN、LSTM 在结构上都是相同的，只是隐状态 H 的计算方式有区别，所以它们加深神经网络的原理都是相同的在深度循环神经网络中，隐状态的信息被传递到当前层的下一时间步和下一层的当前时间步存在许多不同风格的深度循环神经网络，如长短期记忆网络、门控循环单元或经典循环神经网络深度循环神经网络需要大量的调参（如学习率和修剪）来确保合适的收敛，模型的初始化也需要谨慎双向循环神经网络通过反向更新的隐藏层来利用方向时间信息。

基于深度学习的复杂策略学习

weixin_42605076的博客

07-24

845

基于深度学习的复杂策略学习（Complex Strategy Learning）是通过深度学习技术，特别是强化学习和模仿学习，来开发和优化解决复杂任务的策略。这类技术广泛应用于自动驾驶、游戏AI、机器人控制和金融交易等领域。

Mindspore框架循环神经网络RNN模型实现情感分类|（五）模型训练

结果不能复现的原因 GPU cudnn cudnn.benchmark = True

GPU的使用

第一种 不使用cudnn 的配置来复现结果：

应该设置为：

缺点：

第二种 使用cudnn的配置来复现结果

第一种不使用cudnn 的配置来复现结果：

第二种使用cudnn的配置来复现结果