pytorch训练神经网络爆内存解决办法

pytorch训练神经网络爆内存解决办法

训练的时候内存一直在增加,最后内存爆满,被迫中断。
!](https://img-blog.csdnimg.cn/20210323110010729.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2x5ZjZfOTEyMw==,size_16,color_FFFFFF,t_70)
后来换了一个电脑发现还是这样,考虑是代码的问题。
检查才发现我的代码两次存了loss,只有一个地方写的是loss.item()。问题就在loss,因为loss是variable类型。
要写成loss_train = loss_train + loss.item(),不能直接写loss_train = loss_train + loss。否则就会发现随着epoch的增加,占的内存也在一点一点增加。
算是一个小坑吧,希望大家还是要仔细。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch 是一个基于 Python 的科学计算库,它支持动态计算图,使得神经网络的搭建和训练变得非常方便。以下是 PyTorch 搭建神经网络的基本步骤: 1. 导入 PyTorch 库和其他必要的库,如 numpy。 ```python import torch import torch.nn as nn import numpy as np ``` 2. 定义神经网络的结构,可以使用 PyTorch 提供的各种层(如全连接层、卷积层等)来搭建网络。 ```python class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.fc1 = nn.Linear(784, 512) self.fc2 = nn.Linear(512, 256) self.fc3 = nn.Linear(256, 10) def forward(self, x): x = x.view(-1, 784) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x ``` 上面的代码定义了一个三层的全连接神经网络,输入为 784 维,输出为 10 维。 3. 定义损失函数和优化器。 ```python criterion = nn.CrossEntropyLoss() optimizer = torch.optim.SGD(net.parameters(), lr=0.01, momentum=0.9) ``` 上面的代码使用交叉熵作为损失函数,使用随机梯度下降(SGD)作为优化器。 4. 训练神经网络。 ```python for epoch in range(num_epochs): for i, (images, labels) in enumerate(train_loader): images = images.to(device) labels = labels.to(device) optimizer.zero_grad() outputs = net(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() if (i+1) % 100 == 0: print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' .format(epoch+1, num_epochs, i+1, total_step, loss.item())) ``` 上面的代码使用 PyTorch 提供的 DataLoader 加载数据,然后进行迭代训练。在每次迭代中,需要将数据和标签转换为 Tensor,并将其发送到 GPU 上(如果有的话),然后进行正向传播、计算损失、反向传播和更新模型参数。在训练过程中,可以打印出损失值和当前的训练进度。 5. 测试神经网络。 ```python with torch.no_grad(): correct = 0 total = 0 for images, labels in test_loader: images = images.to(device) labels = labels.to(device) outputs = net(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total)) ``` 上面的代码使用测试集来评估神经网络的准确率。在测试时,需要关闭梯度计算,以节省内存和时间。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值