CUDA out of memory.

最新推荐文章于 2024-08-14 09:12:50 发布

Sivan_10

最新推荐文章于 2024-08-14 09:12:50 发布

阅读量1.1k

点赞数

分类专栏：出错集锦文章标签： pytorch

原文链接：https://pytorch.org/docs/stable/notes/faq.html

版权

出错集锦专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文讨论了在PyTorch的训练循环中，如何避免在total_loss上累积autograd的历史记录。作者指出，通常total_loss会自动跟踪梯度，但若需修复，应将其转换为浮点数以防止历史记录的积累。

摘要由CSDN通过智能技术生成

不在 training loop 中积累历史记录。默认情况下，只保留涉及梯度的变量的计算。
比如在在跟踪统计数据时，计算中的变量将超出的 training loop
考虑以下情况

total_loss = 0
for i in range(10000):
    optimizer.zero_grad()
    output = model(input)
    loss = criterion(output)
    loss.backward()
    optimizer.step()
    total_loss += loss

此处，total_loss 正在整个训练循环中累积历史记录，因为 loss 是一个具有 autograd 历史记录的可微变量。
可以通过以下方式修复此问题，改为

total_loss += float(loss)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Sivan_10

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CUDA out of memory.

此处，total_loss 正在整个训练循环中累积历史记录，因为 loss 是一个具有 autograd 历史记录的可微变量。不在 training loop 中积累历史记录。默认情况下，只保留涉及梯度的变量的计算。比如在在跟踪统计数据时，计算中的变量将超出的 training loop。可以通过以下方式修复此问题，改为。
复制链接

扫一扫