20-11-02 Pytorch记录model.eval()

最新推荐文章于 2024-11-02 15:39:54 发布

利先生

最新推荐文章于 2024-11-02 15:39:54 发布

阅读量767

点赞数

文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/Mrlione/article/details/109442100

版权

20-11-02 Pytorch记录model.eval()

训练完train_datasets之后，model要来测试样本了。在model(test_datasets)之前，需要加上model.eval()
因为：
orch.onnx.export()导出onnx模型后，利用onnxruntime加载onnx模型后，其输出结果与原始.pth模型的输出结果之间存在很大的差距；通过拆分网络结构，定位到nn.BatchNorm2d()层导致；

Batch Normalization和Dropout
Batch Normalization
其作用对网络中间的每层进行归一化处理，并且使用变换重构（Batch Normalization Transform）保证每层提取的特征分布不会被破坏。训练时是针对每个mini-batch的，但是测试是针对单张图片的，即不存在batch的概念。由于网络训练完成后参数是固定的，每个batch的均值和方差是不变的，因此直接结算所有batch的均值和方差。所有Batch Normalization的训练和测试时的操作不同。
Dropout
其作用克服Overfitting，在每个训练批次中，通过忽略一半的特征检测器，可以明显的减少过拟合现象。
model.train()和model.eval()
train()
启用 BatchNormalization 和 Dropout
eval()
不启用 BatchNormalization 和 Dropout，保证BN和dropout不发生变化，pytorch框架会自动把BN和Dropout固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层影响结果。
问题解决办法
在利用原始.pth模型进行前向推理之前，一定要先进行model.eval()操作，不启用 BatchNormalization 和 Dropout。
参考链接: link.