pytorch | 填一填pytorch的坑

最新推荐文章于 2023-09-22 15:33:38 发布

小涵涵

最新推荐文章于 2023-09-22 15:33:38 发布

阅读量193

点赞数

分类专栏： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34929889/article/details/108095557

版权

pytorch 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

pytorch | 填一填pytorch的坑😜

1. model.train() 和 model.eval()

模型中如果有 Batch Normalization 或 Dropout 层，测试时，需要加 model.eval()。主要因为在训练和测试时，Batch Normalization 和 Dropout 方法的操作不同导致的。

模型训练前加model.train()，模型变成训练模式，启用 BatchNormalization 和 Dropout。在测试前加model.eval()，模型变成测试模式，不启用 BatchNormalization 和 Dropout，保证Batch Normalization和Dropout不发生变化，pytorch框架会自动把BN和Dropout固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层影响结果。

理解

Batch Normalization
Batch Normalization的作用主要是对网络中间的每层进行归一化处理，并且使用变换重构（Batch Normalization Transform）保证每层提取的特征分布不会被破坏。在训练时，是对每一批的训练数据进行归一化，也即用每一批数据的均值和方差。而在测试时，比如进行一个样本的预测，并没有batch的概念，这个时候用的均值和方差是全量训练数据（所有样本）的均值和方差。pytorch具体实现是采用滑动平均值方法计算，所以最后一旦整个训练阶段完成，BN层中的所有参数也就固定下来，然后直接用于测试。
Dropout
Dropout的作用是在训练过程中以一定的概率的使神经元失活，即输出为0，以提高模型的泛化能力，减少过拟合。测试时，应该用整个训练好的模型，因此不需要Dropout。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小涵涵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。