此问题常见于较多层的训练模型,此时需要改变batch-size的值,但需要注意的是batch-size的值仍需满足2的几次幂这一条件。 resnet18训练结果 resnet50训练结果 可见结果与预想的大致相同。