train和eval在训练集上表现差距很大

最新推荐文章于 2023-06-30 09:34:30 发布

MlllllllllJ.

最新推荐文章于 2023-06-30 09:34:30 发布

阅读量557

点赞数

文章标签：深度学习 python

本文链接：https://blog.csdn.net/qq_44372314/article/details/128240373

版权

目前在训练结束之后发现使用train和eval跑出来的结果很差。于是做了以下测试：

1.为避免问题是过拟合导致的，于是在训练集上使用eval发现替换model.train与model.eval差别很大。并且使用train与训练时计算的loss也有比较大的差距。

2.为避免代码造成的问题，于是将train.py基础上去掉后向传播和模型保存部分，结果与上述一致。

3.根据网上的一些办法，使用以下函数冻结bn层：结果保持不变

def freeze_bn(m):
    classname = m.__class__.__name__
    if classname.find('BatchNorm') != -1:
        m.momentum=1
        #m.track_running_stats = False
        #m.eval()

4.数据处理时加入归一化重新训练，结果表现依然不变

5.将验证时的dropout的概率置0，结果保持不变

backbone使用了resnet，显卡原因batchsize只能到8，我现在这个问题有大佬能帮忙解决吗，感激不尽

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MlllllllllJ.

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
train和eval在训练集上表现差距很大

train和eval在训练集上表现差距很大
复制链接

扫一扫

pytorch 模型的train模式与eval模式实例

09-17

在PyTorch中，模型的`train`模式和`eval`模式是两个关键的状态设置，它们主要用于处理在训练和评估过程中不同操作的行为。这两种模式主要影响到那些在训练期间需要特殊行为的层，如批量归一化（Batch Normalization...

踩坑:pytorch中eval模式下结果远差于train模式介绍

09-16

当我们在训练阶段遇到模型在`train`模式下表现良好，但在`eval`模式下性能大幅下降的问题时，通常需要对数据预处理和模型结构进行深入检查。首先，`train`模式是用于模型训练的，默认启用了Dropout和Batch ...

1 条评论您还未登录，请先登录后发表或查看评论

（完美解决）为什么在train/val/test数据集上用train模式效果都很好，但是在eval模式下全部很差

qq_43391414的博客

07-26

2377

因此，一个简单的对比就是，你在你的模型训练了好几轮，觉得效果不错了之后，停下来，选择几个训练集数据，比如5个，分别在train模式和eval模式下，打印他们输入，中间层以及结尾的结果，这个你自己看着办即可。在train模式下好，eval模式下差，我们可以理解为train模式下，最后一层得到的那一堆向量好，eval得到的那一堆向量差，从而逐步往前推。不管怎么说吧，首先引人注目的就是，我的4个数据，输入的均值和方差都特别不一样，尤其是方差，3万多的方差，吓死。成功了，同时发现，归一化之后训练得很快！...

【pytorch】同一个模型model.train()和model.eval()模式下的输出完全不同

qq_46276946的博客

06-30

785

另一方面，batch normalization层在训练和评估过程中的行为也是不同的。在训练过程中，batch normalization通过均值和方差对输入批次进行归一化，这有助于更快地收敛和更好的泛化能力。这意味着模型的输出在训练和评估过程中可能会有所不同，因为使用了不同的归一化因子。然而，在评估过程中，dropout层不会应用这种随机置零的操作，因此输出是一致的。一些层，如dropout和batch normalization，在训练和评估过程中的行为是不同的。

pytorch train和eval 效果不同的原因

yunshangyue的博客

02-03

535

pytorch

【Pytorch】Pytorch的net.train 和 net.eval的使用区别

qq_51935319的博客

08-10

218

小白学习机器学习中。。。

net.train()和net.eval()

qq_46182334的博客

10-22

2966

pytorch net.train()和net.eval()

【Pytorch】中的net.train()和net.eval()

weixin_45057858的博客

08-13

179

Pytorch】中的net.train()和net.eval()

pytorch:model.train和model.eval用法及区别详解

09-17

在PyTorch中，`model.train()`和`model.eval()`是两个非常关键的方法，它们用于在训练和评估模型时切换不同的运行模式。理解这两者之间的差异对于有效地训练和测试深度学习模型至关重要。首先，`model.train()`...

探究pytorch model.eval()测试效果远差于model.train()

qq_42362891的博客

08-20

4503

探究pytorch model.eval()测试效果远差于model.train()

训练效果不好的解决办法

qq_38517015的博客

10-15

1139

李宏毅机器学习tips for deep learning

eval模式和train模式

qq_42251157的博客

05-19

845

eval模式和train模式得到不同的结果是正常的。我的模型中，eval模式和train模式不同之处在于Batch Normalization和Dropout。Dropout比较简单，在train时会丢弃一部分连接，在eval时则不会。Batch Normalization，在train时不仅使用了当前batch的均值和方差，也使用了历史batch统计上的均值和方差，并做一个加权平均（momentum参数）。在test时，由于此时batchsize不一定一致，因此不再使用当前batch的均值和方差，仅使用历

trian和val结果相差很大。

Snoopy_Dream

12-15

3074

我说的是如果你含有BN层的话，有些人选择把BN层去掉之后，发现trian和val相差不大了。存在的问题：对训练集 accuracy可达0.99 loss=1e-2 -3，然而验证集 accuracy 0.5，loss 很高，试了多个初始学习率（0.1 — 0.0001）都不行解决上述问题：采取warm up方法，对上述问题有点帮助,或者换成SN层，但是显存会增大很多。训练resn...

eval（）与train（）（结合源码理解）

anonymous030的博客

10-20

853

通过源码讲解了eval()和train()的作用，结合BN层加深理解

model.eval()时测试结果远远低于model.train()，如何解决？

qq_36846729的博客

02-17

2016

1. 检查输入数据（train与test）是否经过了归一化 2. 设置model.eval()时，网络中所有bn层里超参 track_running_stats = False 3. 尝试替换BN为LN或GN

【pytorch】model.train和model.eval用法及区别详解

浩瀚之水的专栏

11-11

972

使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval，eval()时，框架会自动把BN和DropOut固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！ Class Inpaint_Network() ...... Model = Inpaint_Nerwoek() #train: Model.train(mode=True) ..... #test: Model.eval()

PyTorch中的train()方法和eval()方法的作用和区别

敲代码的小风

12-05

7878

pytorch可以给我们提供两种方式来切换训练和评估(推断)的模式。分别是： model.train()和model.eval() dropout在训练的时候起作用，在推断的时候被绕过不起作用，或者等价地，将其概率置为零。 batch normalization 也和dropout一样，有两种模式，分别对应训练和推断，分别是: model.eval()和model.train(). 以下是原文截图: dropout: batch normalization: PyTorch官方API

关于Pytorch中的train()和eval()（以及no_grad()）

xu.hyj

07-04

5925

这三个函数实际上很常见，先来简单看下使用方法train()是nn.Module的方法，也就是你定义了一个网络model，那么表示将该model设置为训练模式，一般在开始新epoch训练时，我们会首先执行该命令：同train()一样，其用法和含义也一样，eval()是nn.Module的方法，也就是你定义了一个网络model，那么表示将该model设置为验证模式，一般在开始验证当前model效果时，我......

pytorch train和eval 差异大