目录
问题描述
在预训练模型时,训练到epoch=29时无法继续进行,退出去,输入
nividia-smi
还有空间
解决办法
调整Batch Size(即一次训练所抓取的数据样本数量)的大小
在卷积神经网络中,大的batch size通常可使网络更快收敛,但由于内存资源的限制,batch size过大可能会导致内存不够用,如果GPU内存不够用出现以上情况,可以将Batch Size适当的设置小一点
原来batch_size和学习率lr:
GPU对2的幂次的batch可以发挥更佳的性能,因此设置成16、32、64、128…时往往要比设置为整10、整100的倍数时表现更优
当我们改变batch——size的时候,可能遵循这样的规律
将batch_size和lr修改如下后就可以继续训练而不会内存超限