Pytorch model.eval()的作用

最新推荐文章于 2023-12-21 14:12:18 发布

嘿，兄弟，好久不见

最新推荐文章于 2023-12-21 14:12:18 发布

阅读量1.6w

点赞数 36

分类专栏：深度学习经验总结文章标签：人工智能深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/libaominshouzhang/article/details/119741474

版权

深度学习经验总结专栏收录该内容

20 篇文章 2 订阅

订阅专栏

使用pytorch训练和预测时会分别使用到以下两行代码：

model.train()
model.eval()

后来想了解model.eval()的具体作用，在网上查找资料大都是以下原因：
模型中有BatchNormalization和Dropout，在预测时使用model.eval()后会将其关闭以免影响预测结果。

但是没有找到BN和Dropout是具体如何影响预测结果的，直到看到这篇博客中的内容才有所理解，个人理解如下：
1）训练过程中BN的变化。
在训练过程中BN会不断的计算均值和方差，训练结束后得到最终的均值和方差，在此处将其记为mean_train，variance_train。

2）预测过程中BN的变化。
预测过程中如果不使用model.eval()的话，BN层还是会根据输入的预测数据继续计算均值和方差，假设输入一条预测数据后，BN层计算得到其均值和方差分别为mean_test，variance_test，此时BN层的均值和方差则变成了(mean_train+mean_test),(variance_train+variance_test)，相比于训练过程中的均值和方差发生了变化因此会导致预测结果发生变化。

如果使用model.eval()则BN层就不会再计算预测数据的均值和方差，即在预测过程中BN层的均值和方差就是训练过程得到的均值和方差mean_train，variance_train，此时预测结果就不会再发生变化。

3）训练过程中Dropout的变化
训练过程中依据设置的dropout比例会使一部分的网络连接不进行计算。

4）预测过程中Dropout的变化
预测过程中如果不使用model.eval()的话，依然会使一部分的网络连接不进行计算，而使用model.eval()后就是所有的网络连接均进行计算。

嘿，兄弟，好久不见

关注

36
点赞
踩
80

收藏

觉得还不错? 一键收藏
0
评论
Pytorch model.eval()的作用

使用pytorch训练和预测时会分别使用到以下两行代码：model.train()model.eval()后来想了解model.eval()的具体作用，在网上查找资料大都是以下原因：模型中有BatchNormalization和Dropout，在预测时使用model.eval()后会将其关闭以免影响预测结果。没有看到BN和Dropout是具体如何影响预测结果的，直到看到这篇博客中的内容才有所理解，个人理解如下：1）训练过程中BN的变化。在训练过程中BN会不断的计算均值和方差，训练结束后得到最
复制链接

扫一扫

专栏目录

嘿，兄弟，好久不见 CSDN认证博客专家 CSDN认证企业博客

码龄7年

47: 原创

8万+: 周排名

181万+: 总排名

12万+: 访问

: 等级

1035: 积分

30: 粉丝

110: 获赞

42: 评论

425: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于多标签分类任务的损失函数和评价指标的一点理解
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8033883, 请多输出高质量博客, 帮助更多的人
Pytorch实现模型蒸馏
只说人话绝不装逼: 教师模型不应该是训练好的吗？为啥你这个是学生教师一起训练
记录python读写mysql/clickhouse/odps等常见数据库
CSDN-Ada助手: 非常感谢您分享关于Python读写常见数据库的技术文章，这对其他用户来说一定非常有用。我觉得您可以继续写关于如何优化数据库读写性能的文章，包括使用索引、分区等技术，相信会有更多读者受益。期待您的下一篇文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
python统计每个区间的数值数量
qq_39928434: 请问取values之后数量没有按顺序返回呢
小白对于BERT细节的一点理解
PJlei: 感谢作者的分享，受益良多，一键三连

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。