pytorch中model.eval()和torch.no_grad()的区别

最新推荐文章于 2024-06-11 09:34:15 发布

非晚非晚

最新推荐文章于 2024-06-11 09:34:15 发布

阅读量1.2k

点赞数 2

分类专栏： pytorch 文章标签： pytorch 深度学习模型测试 eval no_grad

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qleelq/article/details/123325119

版权

pytorch 专栏收录该内容

21 篇文章 28 订阅

订阅专栏

model.train()

在train模式下，dropout网络层会按照设定的参数p，设置保留激活单元的概率（保留概率=p)，并且batch norm层会继续计算数据的mean和var等参数并更新，总结如下：
在这里插入图片描述

model.eval()——正常推理

在PyTorch中进行validation时，会使用model.eval()切换到测试或者称为验证模式下。model.eval()仅作用于dropout层和batchnorm层，让其与训练状态不同，相当于 dropout的参数为0 ，batchnorm也 不再更新和计算 mean和var值，而是使用训练阶段学习到的mean和var。

model.eval()不会影响各层的gradient计算行为，即gradient计算和存储与training模式一样，只是不进行反向传播。。
在这里插入图片描述

with torch.no_grad()——没有梯度计算

而 with torch.no_grad()的作用是 停止对梯度的计算和存储 ，从而减少对内存的消耗，不会进行反向传播。

with torch.no_grad()并不会影响dropout和batchnorm层的行为 。

在这里插入图片描述

总结如下：如果不在意显存大小和计算时间的话，仅使用model.eval()已足够得到正确的validation的结果；而with torch.zero_grad()则是更进一步加速和节省gpu空间（因为不用计算和存储gradient），从而可以更快计算，也可以跑更大的batch来测试。

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
pytorch中model.eval()和torch.no_grad()的区别

在PyTorch中进行validation时，会使用model.eval()切换到测试或者称为验证模式下。model.eval()仅作用于dropout层和batchnorm层，让其与训练状态不同，相当于 dropout的参数为0 ，batchnorm也不再更新和计算 mean和var值，而是使用训练阶段学习到的mean和var。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

非晚非晚 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。