实践中发现两个导致显存爆的操作
操作1:将总损失置于判定内计算
##原
if epoch < 5:
loss = loss1
else:
loss = loss1+loss2
##改正后:
if epoch < 5:
loss2 = 0.0
else:
loss2 = xxx
loss = loss1+loss2
操作2:验证时计算loss
显存会超级无敌大爆炸,不断增加直到溢出
虽然解决了问题,但是不知道原理是什么
实践中发现两个导致显存爆的操作
操作1:将总损失置于判定内计算
##原
if epoch < 5:
loss = loss1
else:
loss = loss1+loss2
##改正后:
if epoch < 5:
loss2 = 0.0
else:
loss2 = xxx
loss = loss1+loss2
操作2:验证时计算loss
显存会超级无敌大爆炸,不断增加直到溢出
虽然解决了问题,但是不知道原理是什么