深度学习01：pytorch中model eval和torch no_grad()的区别

最新推荐文章于 2024-05-23 12:38:51 发布

大雄没有叮当猫

最新推荐文章于 2024-05-23 12:38:51 发布

阅读量815

点赞数 2

分类专栏：深度学习 pytorch

本文链接：https://blog.csdn.net/u013230189/article/details/108890769

版权

54 篇文章 2 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

公众号：数据挖掘与机器学习笔记
主要区别如下：

model.eval()会通知所有的网络层目前处于评估模式(eval mode)，因此，batchnorm或者dropout会以评估模式工作而不是训练模式。
- 在train模式下，dropout网络层会按照设定的参数p设置保留激活单元的概率（保留概率=p); batchnorm层会继续计算数据的mean和var等参数并更新。
- 在val模式下，dropout层会让所有的激活单元都通过，而batchnorm层会停止计算和更新mean和var，直接使用在训练阶段已经学出的mean和var值。
- 该模式不会影响各层的gradient计算行为，即gradient计算和存储与training模式一样，只是不进行反传（backprobagation）
torch.no_grad():主要影响autograd梯度计算引擎，停止梯度计算。它会减少内存使用量并加快计算速度，但没法进行反向传播。

参考：

[1] https://blog.csdn.net/songyu0120/article/details/103884586

[2]https://discuss.pytorch.org/t/model-eval-vs-with-torch-no-grad/19615
在这里插入图片描述

关注