EfficientNet训练天坑——eval

赏你个麻辣烫儿

于 2023-12-18 23:47:58 发布

阅读量366

点赞数 8

分类专栏：机器学习文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72708335/article/details/135074177

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、背景描述

模型在训练过程中训练集和测试集准确率都很高：99%；

另外写一个代码进行测试，测试准确率极其拉跨：11%；

why?????各种修改，各种debug，各种死马当活马医；

最终发现一行代码就能解决：model.eval()

二、原因

在PyTorch中，model.eval() 是一种设置模型为评估模式的方法。在评估模式下，模型的行为会发生变化：

Batch Normalization 和 Dropout 的行为变化： 在训练过程中，Batch Normalization 和 Dropout 层通常会采用不同的行为。在评估时，model.eval() 会使得 Batch Normalization 使用全局统计信息而不是 batch 的统计信息，而 Dropout 层会变得无效。这是因为在测试时我们不再需要通过 batch 的统计信息来进行归一化或者随机失活。

在测试阶段，为了得到模型的最终输出而不影响其行为，通常会调用 model.eval() 来确保上述行为的改变。在训练阶段，你通常会使用 model.train() 来将模型设置为训练模式。

总结一下，model.eval() 主要是为了确保在测试阶段模型的行为与训练时一致，并减少内存占用。

赏你个麻辣烫儿

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
EfficientNet训练天坑——eval

会使得 Batch Normalization 使用全局统计信息而不是 batch 的统计信息，而 Dropout 层会变得无效。这是因为在测试时我们不再需要通过 batch 的统计信息来进行归一化或者随机失活。在训练过程中，Batch Normalization 和 Dropout 层通常会采用不同的行为。主要是为了确保在测试阶段模型的行为与训练时一致，并减少内存占用。在测试阶段，为了得到模型的最终输出而不影响其行为，通常会调用。各种修改，各种debug，各种死马当活马医；在训练阶段，你通常会使用。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。