GPU显存不足-优化方案-pytorch

AI 黎明

于 2020-12-03 22:15:56 发布

阅读量4.3k

点赞数 4

分类专栏：深度学习 PyTorch 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liming_2464/article/details/110570388

版权

深度学习同时被 2 个专栏收录

17 篇文章

订阅专栏

16 篇文章

订阅专栏

按照优化成本，对可以减少显存占用方案进行排序：

目录

1.计算总loss时候进行代码优化

loss本身是一个包含梯度信息的 tensor，正确的求损失和的方式为：

total_loss += loss.item()

2.降低batch_size

适当降低batch size，则模型每层的输入输出就会成线性减少，效果相当明显。必须要多个batch_size时候可以采用梯度累计的方式，但是这比上直接降低batch_size占用显存会大点。

传统方式：

for i,(feature,target) in enumerate(train_loader):
    outputs = model(feature)  # 前向传播
    loss = criterion(outputs,target)  # 计算损失

    optimizer.zero_grad()   # 清空梯度
    loss.backward()  # 计算梯度
    optimizer.step()  # 反向传播， 更新网络参数

梯度累计：

for i,(features,target) in enumerate(train_loader):
    outputs = model(images)  # 前向传播
    loss = criterion(outputs,target)  # 计算损失
    loss = loss/accumulation_steps   # 可选，如果损失要在训练样本上取平均

    loss.backward()  # 计算梯度
    if((i+1)%accumulation_steps)==0:
        optimizer.step()        # 反向传播，更新网络参数
        optimizer.zero_grad()   # 清空梯度

3.Relu 的 inplace 参数

激活函数 Relu() 有一个默认参数 inplace ，默认为Flase，当设置为True的时候，我们在通过relu() 计算得到的新值不会占用新的空间而是直接覆盖原来的值，这表示设为True，可以节省一部分显存。

4.释放不需要的张量和变量

采用del释放你不再需要的张量和变量，这也要求我们在写模型的时候注意变量的使用，不要随心所欲，漫天飞舞。

5.数据变小

图像适当的缩小可以极大的降低参数量。

6.精简模型

减少卷积核数量；尽量少的使用 Linear 等。全连接层参数较多，较少参数或则不用全连接层。使用全局平均池化进行替代。

博客等级

码龄6年

48
原创

90
点赞

252
收藏

44
粉丝

关注

私信

热门文章

分类专栏

最新评论

Python_爬虫_爬取豆瓣Top250电影排行榜
福气男孩: 第一个核心程序运行，没有任何显示，是怎么回事
pytorch-CroosEntropyLoss使用详解（多维）
MaarioLu: 可以去查一下手册，https://pytorch.org/docs/stable/generated/torch.nn.CrossEntropyLoss.html?highlight=crossentropy#torch.nn.CrossEntropyLoss。未设reduction，默认reduction = 'mean'，所以输出的是一个平均值
pytorch-CroosEntropyLoss使用详解（多维）
uestc_hjw: 您好，我pytorch版本是1.10.0，复制您的示例代码： >>> loss = nn.CrossEntropyLoss() >>> input = torch.randn(3, 5, 6, 6, requires_grad=True) >>> target = torch.empty(3, 6, 6, dtype=torch.long).random_(2) >>> output = loss(input, target) 发现输出output的是一个值，维度并不是batch_size, W, H
PyTorch_GPU加速测试
twilightIRIS: 您好！我对您的测试做了一些改变测试，结果遇到了一些问题——将两个变量增大了一些，然后运行会发现程序会吃C盘空间（我用pytorch训练神经网络时也会这样） [code=python] a = torch.randn(100000, 10000) # 返回10000行1000列的张量矩阵 b = torch.randn(10000, 2000) # 返回1000行2000列的张量矩阵 [/code] 请问您知道这怎么回事吗
深度学习_卷积神经网络
tiantian的春眠不觉晓: 请问用的哪一本深度学习的书

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。