解决微调模型的时候内存爆炸问题

前一天晚上把模型跑上了,早上一过来发现服务器都连不上了,因为之前遇到过这个问题,所以知道大概率是内存爆了。但是已经忘记上次是怎么解决的了,后悔没有好好记录,可见记录的重要性啊!又得重新去查

train_loss = criterion(train_outputs, train_labels)
model.backward(train_loss)
train_loss = train_loss.detach()

解决办法:要在计算完loss之后将梯度释放掉,不然梯度会已知累加loss_train_list.append(train_loss)因为后面还有这个代码。具体原理还真没搞懂哭

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值