前一天晚上把模型跑上了,早上一过来发现服务器都连不上了,因为之前遇到过这个问题,所以知道大概率是内存爆了。但是已经忘记上次是怎么解决的了,后悔没有好好记录,可见记录的重要性啊!又得重新去查
train_loss = criterion(train_outputs, train_labels)
model.backward(train_loss)
train_loss = train_loss.detach()
解决办法:要在计算完loss之后将梯度释放掉,不然梯度会已知累加loss_train_list.append(train_loss)因为后面还有这个代码。具体原理还真没搞懂哭