pytorch——model.train、model.eval、scheduler.step

最新推荐文章于 2022-07-06 16:16:06 发布

seven_zhouyan

最新推荐文章于 2022-07-06 16:16:06 发布

阅读量1.1k

点赞数 1

本文链接：https://blog.csdn.net/seven_zhouyan/article/details/105612267

版权

https://www.jb51.net/article/180955.htm
使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval，eval（）时，框架会自动把BN和DropOut固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！！！！！！

model.train()
启用 BatchNormalization 和 Dropout
model.eval()
不启用 BatchNormalization 和 Dropout
训练完train样本后，生成的模型model要用来测试样本。在model(test)之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。这是model中含有batch normalization层所带来的的性质。
在做one classification的时候，训练集和测试集的样本分布是不一样的，尤其需要注意这一点。

scheduler.step()：
有的时候需要我们通过一定机制来调整学习率，这个时候可以借助于torch.optim.lr_scheduler类来进行调整；一般地有下面两种调整策略：(通过两个例子来展示一下)
两种机制：LambdaLR机制和StepLR机制；

https://blog.csdn.net/qq_20622615/article/details/83150963
optimizer.step()和scheduler.step()的区别：
optimizer.step()通常用在每个mini-batch之中，而scheduler.step()通常用在epoch里面,但是不绝对，可以根据具体的需求来做。只有用了optimizer.step()，模型才会更新，而scheduler.step()是对lr进行调整。
在scheduler的step_size表示scheduler.step()每调用step_size次，对应的学习率就会按照策略调整一次。所以如果scheduler.step()是放在mini-batch里面，那么step_size指的是经过这么多次迭代，学习率改变一次。