训练模型的代码中,进行前向传播前,使用的self.model.train()和self.model.eval(),有什么用?
如果模型中有BN层(Batch Normalization)和Dropout,需要在训练时添加model.train(),在测试时添加model.eval()。
其中model.train()是保证BN层用每一批数据的均值和方差,而model.eval()是保证BN用全部训练数据的均值和方差;而对于Dropout,model.train()是随机取一部分网络连接来训练更新参数,而model.eval()是利用到了所有网络连接。
转自:https://www.cnblogs.com/demo-deng/p/15166870.html