在实验时,由于GPU显存限制,遇到batch_size不能再增大的情况。为解决该问题,使用梯度累加方法: 不进行梯度累加的方法如下: for i,(images,target) in enumerate(train_loader): # 1. input output images = images.cuda(non_blocking=True) target