牛散村:Pytorch model.train 和model.eval有什么区别？如何使用？

最新推荐文章于 2023-11-08 08:56:18 发布

weixin_45378258

最新推荐文章于 2023-11-08 08:56:18 发布

阅读量331

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45378258/article/details/118928828

版权

本文介绍了Pytorch中model.train()和model.eval()的区别和使用场景。model.train()用于模型训练，启用Batch Normalization和Dropout；model.eval()用于模型测试，关闭Batch Normalization和Dropout的统计计算，确保评估一致性。在加载模型进行推理时忘记使用model.eval()可能导致预测结果准确性下降。

摘要由CSDN通过智能技术生成

在学习机器学习的时候很多小伙伴都会了解到模型的训练和测试，也会了解到两个关于模型训练和测试会涉及到的函数——train和eval，那么model.train和model.eval有什么区别呢？接下来小编就带你来好好了解一下。

在训练模型时会在前面加上：

model.train()

在测试模型时在前面使用：

model.eval()

同时发现，如果不写这两个程序也可以运行，这是因为这两个方法是针对在网络训练和测试时采用不同方式的情况，比如Batch Normalization 和 Dropout。

训练时是正对每个min-batch的，但是在测试中往往是针对单张图片，即不存在min-batch的概念。

由于网络训练完毕后参数都是固定的，因此每个批次的均值和方差都是不变的，因此直接结算所有batch的均值和方差。

所有Batch Normalization的训练和测试时的操作不同

在训练中，每个隐层的神经元先乘概率P，然后在进行激活，在测试中，所有的神经元先进行激活，然后每个隐层神经元的输出乘P。

补充：Pytorch踩坑记录——model.eval()

最近在写代码时遇到一个问题，原本训练好的模型，加载进来进行inference准确率直接掉了5个点，尼玛，这简直不能忍啊～本菜鸡下意识地感知到我肯定又在哪里写了bug了～～～于是开始到处排查，从model load到data load，最终在一个被我封装好的module的犄角旮旯里找到了问题，于是顺便就在这里总结一下，避免

最低0.47元/天解锁文章

weixin_45378258

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
牛散村:Pytorch model.train 和model.eval有什么区别？如何使用？

在学习机器学习的时候很多小伙伴都会了解到模型的训练和测试，也会了解到两个关于模型训练和测试会涉及到的函数——train和eval，那么model.train和model.eval有什么区别呢？接下来小编就带你来好好了解一下。在训练模型时会在前面加上：model.train()在测试模型时在前面使用：model.eval()同时发现，如果不写这两个程序也可以运行，这是因为这两个方法是针对在网络训练和测试时采用不同方式的情况，比如Batch Normalization 和 Dropout
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

weixin_45378258 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。