训练与测试时同一组测试集结果不一致

最新推荐文章于 2023-06-06 14:58:00 发布

飞往宇宙

最新推荐文章于 2023-06-06 14:58:00 发布

阅读量5.1k

点赞数 3

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/u014714362/article/details/109394056

版权

pytorch 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

训练与测试时同一组测试集结果不一致，相当于训练的模型不能后续使用了，这肯定不能容忍，所以耗费经历筛查：

1. 随机种子的设置问题

可在main函数加上这个：

SEED = 1
np.random.seed(SEED)
torch.manual_seed(SEED)
torch.cuda.manual_seed_all(SEED)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False

但是我在数据加载的地方也用到了np.random函数，所以要在数据加载的init函数里加上：

SEED = 1
np.random.seed(SEED)

2. 存储整个模型，而不是用state_dict()

torch.save(model, path)   #存储
model = torch.load(path)  #加载，不用事先定义模型

3.数据预处理不一致

数据预处理阶段用到了 np.random.normal，如果测试时重新加载数据的话，模型效果就会变差。

需要保证数据预处理是一致的，最好的方法就是只处理一次数据，然后将处理后的数据保存到文件，多次运行模型时直接调用该数据文件。

这个改正后，重新加载测试与train后测试的结果完全一样。

4. model.eval()

测试之前一定要用

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

飞往宇宙

关注关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【深度学习——CNN】训练集准确率和测试集准确率都是1（train_acc:1.000 ,val_acc=1.000）是怎么回事？

weixin_43201920的博客

05-09

1万+

python划分训练集和测试集_python机器学习：如何划分训练集和测试集

weixin_39775029的博客

11-26

4065

今天用一个实例给大家写写在机器学习中如何进行训练集和测试集的划分。实例操练首先导入今天要使用的数据集import pandas as pddf = pd.read_csv("carprices.csv")df.head()这是一个汽车销售的数据集，里面的变量包括汽车里程、使用年限、销售价格。我们今天要做的就是用汽车里程、使用年限来建立一个预测销售价格的机器学习模型。首先，我们画图看一看数据关系im...

9 条评论您还未登录，请先登录后发表或查看评论

相同的数据集，验证与测试的结果完全不同 —— pytorch model.eval() !

weixin_44210775的博客

03-15

2774

问题背景：这几天重构了我自己的训练代码，但出现一个问题，原本随便一跑就能复现原论文效果的程序，竟然怎么训练也出不来结果。发现过程：首先我反复核对了我写的Dataset类、模型初始化方法、模型参数（学习率，milestone等等）以及训练代码，没有任何问题。但是训练完还是没有效果！然后我在训练程序里添加了val环节，验证集与测试集相同，发现训练时的验证结果竟然与测试结果相距甚远，又反复核对验证程序与测试程序，发现测试程序少了一句model.eval(). 加上之后果然行了！结论：导致这个现象的原因

pytorch模型加载跑测试集和训练过程中跑测试集结果不一致的问题？

weixin_45564943的博客

04-21

4554

前馈网络使用with torch.no_grad()和model.eval()比较问题描述将训练好的模型拿来做inference，发现显存被占满，无法进行后续操作，但按理说不应该出现这种情况。 RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 6.94 GiB already allocated; 10.56 MiB free; 7.28 GiB ...

同样的数据用神经网络训练和验证的差距很大

itachx的博客

05-11

561

下面代码主要是利用pytorch对轴承数据的预处理并搭建神经网络进行训练和测试，在测试中发现，输出结果与实际不符，然后将测试用的数据换成了和训练用数据相同的数据，但最后的训练和测试的结果却完全不同，下面为全部的代码。用相同的数据进行训练和测试的部分（本人怀疑代码有问题的部分，从完整的代码中截取）如下。

解决pytorch模型加载跑测试集和训练过程中跑测试集结果不一致的问题——功夫不负有心人

weixin_45252975的博客

06-06

1531

解决load模型后的test分数与训练时直接test的分数不同的问题

Pytorch在测试与训练过程中的验证结果不一致问题

the步履不停shy的博客

11-18

4907

引言今天在使用Pytorch导入此前保存的模型进行测试，在过程中发现输出的结果与验证结果差距甚大，经过排查后发现是forward与eval()顺序问题。现象此前的错误代码是 input_cpu = torch.ones((1, 2, 160, 160)) target_cpu =torch.ones((1, 2, 160, 160)) target_gpu, inpu...

用pandas划分数据集实现训练集和测试集

09-16

为解决这个问题，我们可以采用k折交叉验证（k-fold Cross-Validation），它将数据集分成k个互斥的部分，依次用k-1部分作为训练集，剩余部分作为测试集，重复k次，这样每个样本都恰好被用于测试一次。sklearn.model_...

python 划分训练集 测试集 验证集_如何正确使用机器学习中的训练集、验证集和测试集？...

weixin_35123047的博客

02-09

2338

训练集、验证集和测试集，林林总总的数据集合类型，到底该怎么选、怎么用？看过这篇教程后，你就能游刃有余地处理它们了。1问题审稿的时候，不止一次，我遇到作者错误使用数据集合跑模型准确率，并和他人成果比较的情况。他们的研究创意有的很新颖，应用价值较高，工作可能也做了着实不少。但因对比方法错误，得出来的结果，不具备说服力。几乎全部都需要返工。这里，我帮你梳理一下，该怎么使用不同的数据集合：训练集(trai...

label y 训练集测试集x_训练集和测试集

weixin_39692557的博客

02-06

1168

训练集和测试集train set 用来训练模型，估计参数test set 用来测试和评估训练出来的模型好坏，不能用于训练模型我们将所有数据分成训练集和测试集两部分，我们用训练集进行模型训练，得到的模型再用测试集来衡量模型的预测表现能力train_test_split(x,y, test_size , random_state)将数据随机分成训练集和测试集x,y 需要分割的 feature 和 ta...

minist数据集训练与测试

weixin_61576710的博客

08-19

2301

pytorch 加载训练好的模型后测试得到的结果不一样

weixin_38906715的博客

06-09

2067

1、训练模型，在模型train模式下，运行测试图片，得到结果正确：5200240905064，保存此模型，2、加载训练好的pth模型，调用model.eval(),在eval模式下，去测试我下载的一张图片，发现结果为：5200240905064。可能原因是train模式和eval模式模型运行结果不同解决方案：1、在训练模型进行评估之前，调用model.eval(),让模型工作在eval模式下进行模...

测试集多次测试结果不一致原因总结

qq_34741153的博客

08-05

4364

所有的原因可以归结为测试过程中出现了随机的情况，但随机发生的原因不一而论。一、数据预处理使用随机变换操作为了使模型更具鲁棒性，训练集数据的预处理往往会使用随机裁剪、随机水平垂直变换、随机仿射变换等数据增强手段，但在测试集数据的预处理过程务必避免随机操作的出现。这会导致每次输入的数据存在一定的偏差，进而导致模型预测结果的偏差。这种情况下，模型准确率一般会在较小的范围波动。二、测试过程为开启评估模式即mo...

pytorch模型加载跑测试集和训练过程中跑测试集结果不一致的问题

qq_42262373的博客

05-22

1万+

今天遇到个问题，保存训练完成的神经网络模型，来尝试跑了下测试集的结果，发现效果很差，和训练网络时跑测试集的结果不一样。查了些资料，发现是先eval()再测试数据的问题：错误写法： ..... model = torch.load('model.pkl') model.eval() #先eval x = model.forward(x) #然后传递数据进行测试 ..... 正确写法： ....

Pytorch 加载多gpu模型+解决加载模型测试结果不正确

sd-lz的博客

05-06

2360

将模型加载到多gpu上的时候，会用到 model = torch.nn.DataParallel(model, device_ids=[1, 2, 3]) 因此在保存模型的时候，若直接 torch.save(model.state_dict(), save_dict_path) 加载后的模型参数每个都会带有 module 如果使用strict=False的加载方式，很有可能会使测试结果不同 model.load_state_dict(weights_dict, strict=False)

用深度学习每次得到的结果都不一样，怎么办？

小孔乘象的天地

05-11

5960

神经网络算法利用了随机性，比如初始化随机权重，因此用同样的数据训练同一个网络会得到不同的结果。初学者可能会有些懵圈，因为算法表现得不太稳定。但实际上它们就是这么设计的。随机初始化可以让网络通过学习，得到一个所学函数的很好的近似。然而，有时候用同样的数据训练同一个网络，你需要每次都得到完全相同的结果。例如在教学和产品上。在这个教程中，你会学到怎样设置随机数生成器，才能每次用同样的数据训练同一网络时，都能得到同样的结果。我们开始。教程概览这个教程分...

pytorch中model.eval的作用