pytorch | 填一填pytorch的坑

pytorch | 填一填pytorch的坑😜

1. model.train() 和 model.eval()

模型中如果有 Batch Normalization 或 Dropout 层,测试时,需要加 model.eval()。主要因为在训练和测试时,Batch Normalization 和 Dropout 方法的操作不同导致的。

模型训练前加model.train(),模型变成训练模式,启用 BatchNormalization 和 Dropout。在测试前加model.eval(),模型变成测试模式,不启用 BatchNormalization 和 Dropout,保证Batch Normalization和Dropout不发生变化,pytorch框架会自动把BN和Dropout固定住,不会取平均,而是用训练好的值,不然的话,一旦test的batch_size过小,很容易就会被BN层影响结果。

理解
  • Batch Normalization
    Batch Normalization的作用主要是对网络中间的每层进行归一化处理,并且使用变换重构(Batch Normalization Transform)保证每层提取的特征分布不会被破坏。在训练时,是对每一批的训练数据进行归一化,也即用每一批数据的均值和方差。而在测试时,比如进行一个样本的预测,并没有batch的概念,这个时候用的均值和方差是全量训练数据(所有样本)的均值和方差。pytorch具体实现是采用滑动平均值方法计算,所以最后一旦整个训练阶段完成,BN层中的所有参数也就固定下来,然后直接用于测试。
  • Dropout
    Dropout的作用是在训练过程中以一定的概率的使神经元失活,即输出为0,以提高模型的泛化能力,减少过拟合。测试时,应该用整个训练好的模型,因此不需要Dropout。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小涵涵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值