如果训练的时候用了BatchNorm,那么前向的时候也要用一样大小的Batch,否则预测不准呀详情参见BatchNrom的计算式使用batch_norm能更快地收敛是真的 看这里,BatchNorm的说明