Pytorch踩坑记录：关于用net.eval()和with no grad装饰器计算结果不一样的问题

最新推荐文章于 2024-08-10 16:03:14 发布

西柚西柚xiu

最新推荐文章于 2024-08-10 16:03:14 发布

阅读量2.7k

点赞数 6

分类专栏： pytorch 文章标签：深度学习

本文链接：https://blog.csdn.net/tanking66/article/details/124473760

版权

pytorch 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Pytorch踩坑记录

相同点
net.eval()和with toch.no_grad()的相同点：都停止反向传播

不同点：
1、net.eval()
用net.eval（），此时BN层会用训练时的均值和方差。不重新计算输入数据的均值和方差，dropout会让所有激活单元都通过。

2、with toch.no_grad()
用with no grad()，BN层仍会计算输入数据的方差和均值，DropOut会按照设定的比例停止某些激活单元的传输。

对于测试集来说，要使用net.eval，因为使用with no_grad()计算了BN层会导致数据泄露的问题。
对于验证集来说，则使用哪个都可以。

经过我个人测试发现，在使用with toch.no_grad()，和net,eval()上的精度完全不一样。
如果训练的时候把测试集当作验证集，此时使用with toch.no_grad()来阻止反向传播，保存的模型，加载时调用test文件时使用net,eval，测试的精度会更低。

因此，如果把测试集做验证集使用，应该使用net,eval()。而如果是使用了验证集，验证集的数据不与测试集交叉，则用哪个都行。

仅个人拙见。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

西柚西柚xiu

关注关注

6
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Pytorch实用教程：Pytorch中model.eval()和torch.no_grad()的作用及用法

若北辰

04-07

1375

`model.eval()` 在 PyTorch 中是一个重要的方法，用于设置模型为`评估模式`。在`模型测试`或`应用于实际问题`时通常会使用的模式。在训练模式和评估模式之间切换是非常重要的，因为它们在某些层的行为上有所不同。

PyTorch踩坑记录：解决常见问题和技巧

AvGroovy的博客

09-18

111

通过仔细检查张量形状、减少内存占用、处理梯度问题、正确保存和加载模型以及解决GPU内存问题，您可以更好地应对这些挑战，并更有效地使用PyTorch进行深度学习任务。首先，可以使用合适的权重初始化方法，如Xavier或He初始化，以确保梯度在前向和反向传播中保持稳定。其次，可以将模型的部分层移动到CPU上，以释放GPU内存。然而，在使用PyTorch的过程中，我们可能会遇到一些常见的问题和挑战。确保在保存模型时，将模型的状态字典（state_dict）保存下来，而不是整个模型。函数重塑张量的形状，或者使用。

参与评论您还未登录，请先登录后发表或查看评论

关于Pytorch中net.eval()和torch.no_grad()的意义理解

最新发布

Qinerdengme的博客

08-10

1103

net.eval(): 将模型切换到评估模式，以确保模型在评估时使用训练好的权重及参数，不进行像 Batch Normalization 和 Dropout 的动态更新。: 禁用自动求导引擎，以节省内存并提高推理速度，同时避免不必要的梯度计算。这些操作一起确保了模型在评估时的效率和稳定性。是的，PyTorch 的梯度计算是自动求导的，依赖于其autograd机制。在需要的情况下，比如模型训练时，自动求导引擎会记录操作并计算梯度。在不需要梯度的地方（如模型评估），可以使用。

踩坑日记：pytorch模型训练train模式和eval模式结果相差甚远？

weixin_39353767的博客

02-07

3712

[pytorch笔记]net.eval和with torch_no_grad

万万VV

03-04

9631

在使用net.eval( )和with torch_no_grad( )时，发现网上有的例子只使用了一个，有些两个都用了，我之前也认为这两个的作用一样，后来发现最好是两个都用。 with torch_no_grad( )：数据不需要梯度计算，即不会进行反相传播; net.eval( )：不加的话即使没有训练输入数据也会改变权值，因为这是禁止forward过程对参数造成的影响;例如禁止dropo...

pytorch中model eval和torch no grad()的区别

江前云后的专栏

01-08

2万+

model.eval()和with torch.no_grad()的区别在PyTorch中进行validation时，会使用model.eval()切换到测试模式，在该模式下，主要用于通知dropout层和batchnorm层在train和val模式间切换在train模式下，dropout网络层会按照设定的参数p设置保留激活单元的概率（保留概率=p); batchnorm层会继续计算数据......

相同的数据集，验证与测试的结果完全不同 —— pytorch model.eval() !

weixin_44210775的博客

03-15

2885

问题背景：这几天重构了我自己的训练代码，但出现一个问题，原本随便一跑就能复现原论文效果的程序，竟然怎么训练也出不来结果。发现过程：首先我反复核对了我写的Dataset类、模型初始化方法、模型参数（学习率，milestone等等）以及训练代码，没有任何问题。但是训练完还是没有效果！然后我在训练程序里添加了val环节，验证集与测试集相同，发现训练时的验证结果竟然与测试结果相距甚远，又反复核对验证程序与测试程序，发现测试程序少了一句model.eval(). 加上之后果然行了！结论：导致这个现象的原因

pytorch同样数据进行eval时有不同的输出

weixin_41333775的博客

03-03

1263

训练好的模型，对同一个数据进行predict，发现每次结果都不一样。原因是在model.eval()之前调用了torchsummary.summary来查看模型结构，说明summary函数会改变模型权重（只改变BN还是都改变？），把summary函数放到model.eval()之后发现输出就保持不变，说明summary函数会改变model的BN参数（我的model里没有dropout）。 net.eval() # freeze BN and Dropout summary(net, input_

pytorch中with torch.no_grad(): && model.eval()

ZwaterZ的博客

07-22

1974

with是python中上下文管理器，简单理解，当要进行固定的进入，返回操作时，可以将对应需要的操作，放在with所需要的语句中。比如文件的写入（需要打开关闭文件）等。以下为一个文件写入使用with的例子。后部分，可以将with后的语句运行，将其返回结果给到as后的变量（sh），之后的代码块对close进行操作。...

深入理解model.eval()与torch.no_grad()

雷恩Layne

07-23

1万+

我们用pytorch搭建神经网络经常见到model.eval()与torch.no_grad()，它们有什么区别？是怎么工作的呢？现在就让我们来探究其中的奥秘 model.eval() 使用model.eval()切换到测试模式，不会更新模型的k，b参数通知dropout层和batchnorm层在train和val中间进行切换在train模式，dropout层会按照设定的参数p设置保留激活单元的概率（保留概率=p，比如keep_prob=0.8），batchnorm层会继续计算数据的mean和va.

model.eval()与with torch.no_grad()

star_xxzeng的博客

09-01

6576

requires_grad、volatile与no_gradrequires_gradvolatileno_gradmodel.eval()与with torch.no_grad() 总结： requires_grad=True 要求计算梯度 requires_grad=False 不要求计算梯度 with torch.no_grad()或者@torch.no_grad()中的数据不需要计算梯度，也不会进行反向传播。（torch.no_grad()是新版本pytorch中volatile的替代） requi

（完美解决）为什么在train/val/test数据集上用train模式效果都很好，但是在eval模式下全部很差

qq_43391414的博客

07-26

2630

因此，一个简单的对比就是，你在你的模型训练了好几轮，觉得效果不错了之后，停下来，选择几个训练集数据，比如5个，分别在train模式和eval模式下，打印他们输入，中间层以及结尾的结果，这个你自己看着办即可。在train模式下好，eval模式下差，我们可以理解为train模式下，最后一层得到的那一堆向量好，eval得到的那一堆向量差，从而逐步往前推。不管怎么说吧，首先引人注目的就是，我的4个数据，输入的均值和方差都特别不一样，尤其是方差，3万多的方差，吓死。成功了，同时发现，归一化之后训练得很快！...

pytorch的model.eval()和with torch.no_grad()

weixin_43646592的博客

11-09

1486

⭐model.eval() : 主要是用在forward中，通过设置成model.eval()，告诉所有层在 eval 模式，其中涉及到的BN 和 Dropout 层，这些层在训练和测试的表现是不一样的，比如 dropout 在训练中可能是0-1间的数，但在eval模式则为不使用dropout层。 ⭐with torch.no_grad() : 会关闭自动求导引擎的，因此能节省显存，和加速。 ????Example: # 开启验证模式 model.eval() for sample in tqdm(

【pytorch】 with torch.no_grad():用法详解

热门推荐

sazass的博客

05-11

16万+

在pytorch写的网络中，with torch.no_grad():非常常见。首先，关于python中的with： with 语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭／线程中锁的自动获取和释放等。例如： file = open("１.txt") data = file.read() file.close() 存在问题如下：（１）文件读取发生异常，但没有进行任何处理；（２）可能忘记关闭文件句柄；改进： try:

Pytorch 模型训练模式和eval模型下差别巨大（Pytorch train and eval）附解决方案

xiaoxifei的专栏

05-29

9461

当pytorch模型写明是eval()时有时表现的结果相对于train(True)差别非常巨大，这种差别经过逐层查看，主要来源于使用了BN，在eval下，使用的BN是一个固定的running rate，而在train下这个running rate会根据输入发生改变。解决方案是冻住bn def freeze_bn(m): if isinstance(m, nn.BatchNorm2d...

pytorch中model.eval()和model.train()以及with torch.no_grad

开飞机的小毛驴儿

03-31

920

转载自：https://blog.csdn.net/a250225/article/details/108589205，本文只做个人记录学习使用，版权归原作者所有。一、pytorch中的model.eval()和model.train() 1.model.eval() eval主要用来影响网络中的dropout层和batchnorm层的行为。在dropout层保留所有的神经网络单元，batchnorm层使用在训练阶段学习得到的mean和var值。另外，eval不会影响网络参数的梯度计算，只不过不回传

pytorch出现RuntimeError: CUDA out of memory.

pursuit_zhangyu的博客

03-21

12万+

无论batch-size设置多小也是会出现这个问题的，我的原因是我将pytorch升级到了1.0.1，然后出现了这个问题 RuntimeError: CUDA out of memory. Tried to allocate 823.88 MiB (GPU 0; 7.93 GiB total capacity; 6.96 GiB already allocated; 189.31 MiB fr...

pytorch | with torch.no_grad()

Ddddddd_158的博客

03-30

1858

pytorch | with torch.no_grad()

pytorch中with torch.no_grad():

星之所望的博客

01-25

1万+

1.关于with with是python中上下文管理器，简单理解，当要进行固定的进入，返回操作时，可以将对应需要的操作，放在with所需要的语句中。比如文件的写入（需要打开关闭文件）等。以下为一个文件写入使用with的例子。 with open (filename,'w') as sh: sh.write("#!/bin/bash\n") sh.write("#$ -N "+'IC'+altas+str(patientNumb

.eval和with torch.no_grad():

07-31

.eval和with torch.no_grad()都是在PyTorch中用于控制模型的运行模式的方法。.eval()方法用于将模型设置为评估模式，即在测试或验证阶段使用。在评估模式下，模型的行为会发生一些改变，例如Batch Normalization和...