【pytorch函数】model.train() 和 model.eval()函数理解、BatchNorm和Dropout

最新推荐文章于 2023-12-21 13:50:44 发布

知己不识君

最新推荐文章于 2023-12-21 13:50:44 发布

阅读量1.1k

点赞数 3

分类专栏： pytorch函数文章标签： pytorch 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42745706/article/details/124235659

版权

pytorch函数专栏收录该内容

8 篇文章 0 订阅

订阅专栏

网络训练时添加model.train()，测试时添加model.eval()

如果模型中有BN层(Batch Normalization）和Dropout，需要在训练时添加model.train()，在测试时添加model.eval()。
其中，model.train()是保证BN层用每一批数据的均值和方差，而model.eval()是保证BN用全部训练数据的均值和方差；
而对于Dropout，model.train()是随机取一部分网络连接来训练更新参数，而model.eval()是利用到了所有网络连接。

Batch Normalization
1、神经网络在训练过程中，数据分布对训练会产生影响，如下图所示
2、BN层对网络每一个隐藏层做归一化处理
3、BN层添加在激活函数之前
4、BN算法除了要标准化，还需要反标准化
在这里插入图片描述

反标准化：
加入了缩放参数 gamma和平移参数 β，它们是神经网络需要学习的参数。当标准化效果好时，尽量不抵消标准化的作用，而在标准化效果不好时，尽量去抵消一部分标准化的效果，相当于让神经网络学会要不要标准化，如何折中选择

Dropout
Dropout能够克服Overfitting，在每个训练Batch中，通过忽略一半的特征检测器，可以明显的减少过拟合现象在这里插入图片描述

在训练中，每个隐层的神经元先乘以概率P，然后再进行激活
在测试中，所有的神经元先激活，然后每个隐层神经元的输出乘P

知己不识君

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【pytorch函数】model.train() 和 model.eval()函数理解、BatchNorm和Dropout

网络训练时添加model.train()，测试时添加model.eval()如果模型中有BN层(Batch Normalization）和Dropout，需要在训练时添加model.train()，在测试时添加model.eval()。其中，model.train()是保证BN层用每一批数据的均值和方差，而model.eval()是保证BN用全部训练数据的均值和方差；而对于Dropout，model.train()是随机取一部分网络连接来训练更新参数，而model.eval()是利用到了所有网络连接.
复制链接

扫一扫

专栏目录

知己不识君 CSDN认证博客专家 CSDN认证企业博客

码龄6年

46: 原创

7712: 周排名

75万+: 总排名

26万+: 访问

: 等级

920: 积分

1万+: 粉丝

195: 获赞

107: 评论

939: 收藏

私信

关注

热门文章

分类专栏

opencv 5篇
Windows 2篇
pytorch 4篇
Python函数学习 6篇
算法与数据结构
pytorch函数 8篇
QT 1篇
Fiddler 1篇
pytorch报错 3篇
python报错 3篇
Python北大陈斌 4篇
Python 7篇
C语言 2篇
Comsol 4篇
Matlab 1篇
C++ 2篇
Tensorflow 1篇

最新评论

cuda和cudnn下载安装
m0_60430642: 严重性代码说明项目文件行禁止显示状态详细信息错误 MSB3721 命令“"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\bin\nvcc.exe" -gencode=arch=compute_52,code=\"sm_52,compute_52\" --use-local-env -ccbin "C:\Program Files\Microsoft Visual Studio\2022\Professional\VC\Tools\MSVC\14.40.33807\bin\HostX64\x64" -x cu -I"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include" -I"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include" -G --keep-dir CudaRuntime11\x64\Debug -maxrregcount=0 --machine 64 --compile -cudart static -g -DWIN32 -DWIN64 -D_DEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W3 /nologo /Od /FdCudaRuntime11\x64\Debug\vc143.pdb /FS /Zi /RTC1 /MDd " -o C:\Users\田孜桐\source\repos\CudaRuntime11\CudaRuntime11\x64\Debug\kernel.cu.obj "C:\Users\田孜桐\source\repos\CudaRuntime11\kernel.cu"”已退出，返回代码为 1。 CudaRuntime11 C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Microsoft\VC\v170\BuildCustomizations\CUDA 12.0.targets 794
QT6.1.2下载和安装教程
墨城烟柳ベ旧人殇: 纯恶心，下三个小时，下载后文件都不见了，垃圾安装教程来祸害人
QT6.1.2下载和安装教程
想想啊啊啊: 为什么我的账户是商务型的啊，怎么改啊
QT6.1.2下载和安装教程
入梦游: 下载安装完了，发现Qt和Qt Creator是两个东东
QT6.1.2下载和安装教程
lin|van: 为什么准备安装的时候显示空间不够(刚好是c盘的剩余空间)，但是指定安装那部分是选的e盘

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。