深度学习运用小批次训练减少显存占用

最新推荐文章于 2024-10-08 16:22:21 发布

天天进步2015

最新推荐文章于 2024-10-08 16:22:21 发布

阅读量180

点赞数 11

分类专栏：机器学习文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/exlink2012/article/details/142750851

版权

机器学习专栏收录该内容

19 篇文章 1 订阅

订阅专栏

深度学习模型通常需要处理大量数据,但GPU显存是有限的。小批次训练是一种有效的技术,可以在有限显存下训练大型模型。其基本思想是:

将整个训练数据集分成多个小批次
每次只加载一个小批次的数据到GPU
对这个小批次进行前向传播和反向传播
更新模型参数
清除当前批次,加载下一个批次,重复上述过程

这样就可以显著减少单次占用的显存,使得在有限显存条件下也能训练大模型。

PyTorch示例

下面是一个使用PyTorch实现小批次训练的具体例子:

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个简单的神经网络
class SimpleNet(nn.Module):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 10)
    
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 创建模型、损失函数和优化器
model = SimpleNet()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 假设我们有一个大数据集
big_dataset = torch.randn(100000, 784)  # 100,000个样本,每个784维
labels = torch.randint(0, 10, (100000,))  # 对应的标签

# 设置batch size
batch_size = 32

# 训练循环
for epoch in range(10):  # 10个epoch
    for i in range(0, len(big_dataset), batch_size):
        # 获取当前批次
        batch = big_dataset[i:i+batch_size]
        batch_labels = labels[i:i+batch_size]
        
        # 前向传播
        outputs = model(batch)
        loss = criterion(outputs, batch_labels)
        
        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    
    print(f"Epoch {epoch+1} completed")

print("Training finished")