model.train()和model.eval()

最新推荐文章于 2024-03-15 15:28:45 发布

Pr Young

最新推荐文章于 2024-03-15 15:28:45 发布

阅读量1.1k

点赞数 3

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_47414034/article/details/124971517

版权

深度学习专栏收录该内容

35 篇文章 3 订阅

订阅专栏

model.train()：进入训练状态,让你的模型知道现在正在训练
model.eval()：让你的模型知道自己正在进行预测或者测试,等效于model.train(false),

两种不同状态下，batchnorm层和dropout层是不同的
训练模式下：（1）BatchNorm layers use per-batch statistics，即BatchNorm 层利用每个 batch 
                来统计（用到每一批数据的均值和方差）
          （2）Dropout layers activated，即Dropout 层激活，启用Dropout
预测模式下（或者说推理模式下）：（1）BatchNorm layers use running statistics，BN层用全部训
                                   练数据的均值和方差，即测试过程中BN层的均值和方差不变
                              （2）Dropout layers de-activated，即Dropout 层不激活，
                                   不启用Dropout，利用到了 所有 网络连接，即不进行随机舍弃
                                    神经元
                               总之：model.eval()会把权重值给固定住，用训练好的值

Pr Young

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
model.train()和model.eval()

model.train()：进入训练状态,让你的模型知道现在正在训练model.eval()：让你的模型知道自己正在进行预测或者测试,等效于model.train(false),两种不同状态下，batchnorm层和dropout层是不同的训练模式下：（1）BatchNorm layers use per-batch statistics，即BatchNorm 层利用每个 batch 来统计（用到每一批数据的均值和方差）（2）Dropout ..
复制链接

扫一扫