pytorch测试的时候为何要加上model.eval()？

最新推荐文章于 2023-12-21 14:12:18 发布

passion-ma

最新推荐文章于 2023-12-21 14:12:18 发布

阅读量859

点赞数 2

分类专栏： python 文章标签： pytorch 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42262610/article/details/126049203

版权

python 专栏收录该内容

44 篇文章 1 订阅

订阅专栏

很多机器学习的教程都有提到，在使用pytorch进行训练和测试的时候一定要给实例化的model指定eval，那么pytorch测试时为什么要设置model.eval()呢？model.eval()的功能是什么？接下来的这篇文章告诉你。

使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval，eval（）时，框架会自动把BN和DropOut固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！！！！！！

model.eval()和with torch.no_grad()的区别

在PyTorch中进行validation时，会使用model.eval()切换到测试模式，在该模式下，

主要用于通知dropout层和batchnorm层在train和val模式间切换

在train模式下，dropout网络层会按照设定的参数p设置保留激活单元的概率（保留概率=p); batchnorm层会继续计算数据的mean和var等参数并更新。

在val模式下，dropout层会让所有的激活单元都通过，而batchnorm层会停止计算和更新mean和var，直接使用在训练阶段已经学出的mean和var值。

该模式不会影响各层的gradient计算行为，即gradient计算和存储与training模式一样，只是不进行反传（backprobagation）

而with torch.no_grad()则主要是用于停止autograd模块的工作，以起到加速和节省显存的作用，具体行为就是停止gradient计算，从而节省了GPU算力和显存，但是并不会影响dropout和batchnorm层的行为。

不理解为什么在训练和测试函数中model.eval()，和model.train()的区别，经查阅后做如下整理

一般情况下，我们训练过程如下：

1、拿到数据后进行训练，在训练过程中，使用

model.train(）：告诉我们的网络，这个阶段是用来训练的，可以更新参数。

2、训练完成后进行预测，在预测过程中，使用

model.eval() ：告诉我们的网络，这个阶段是用来测试的，于是模型的参数在该阶段不进行更新。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pytorch测试的时候为何要加上model.eval()？

很多机器学习的教程都有提到，在使用pytorch进行训练和测试的时候一定要给实例化的model指定eval，那么pytorch测试时为什么要设置model.eval()呢？model.eval()的功能是什么？接下来的这篇文章告诉你。使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval，eval（）时，框架会自动把BN和DropOut固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！...
复制链接

扫一扫

专栏目录

passion-ma CSDN认证博客专家 CSDN认证企业博客

码龄6年

71: 原创

8万+: 周排名

8万+: 总排名

16万+: 访问

: 等级

975: 积分

66: 粉丝

182: 获赞

23: 评论

823: 收藏

私信

关注

热门文章

分类专栏

linux 9篇
python 44篇
操作系统-ubuntu 7篇
c++ 7篇
opencv 1篇
pytorch 5篇
CPU 1篇
语义分割 3篇
CentOS服务器 3篇
json 1篇
图像合成
网络协议 1篇
mask rcnn 1篇
xml
anaconda 1篇
Nvidia Jetson Xavier/NX 4篇

最新评论

升级Python3.6到Python3.7
m0_74755621: 打不开终端了
将标注好的yolo格式数据集划分为yolov5所适用的训练集和测试集
向疯: 你好啊，关于数据集这块我也不太懂，好像运行train.py根本不涉及test数据集，train.py完的结果图感觉好像是train+val的结果
Visual Studio 2015配置OpenCV4.5.3(c++版)
老小笨鸟: 4.5.3，vs2015支持嘛？我看有的说vs2015只支持到4.4
cv2.drawContours()、cv2.findContours()、cv2.boundingRect(img)函数用法解析
xmxmyoyo: 这两种，二值化有什么区别？下面那个是官网示例，有的图形检测不出边框，用第一种就可以检测出来。 ret, binary = cv.threshold(canny_output,0,130,cv.THRESH_BINARY | cv.THRESH_OTSU) ret, thresh = cv2.threshold(imgray, 127, 255, 0)
ubuntu下使用filezilla上传文件权限问题
躺着的废鱼: filezilla没有下载限权怎么解决,老师不给

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。