PyTorch内存与参数管理笔记

yuanhui0325

于 2024-04-13 18:34:51 发布

阅读量233

点赞数 3

分类专栏：代码相关文章标签： pytorch 笔记

本文链接：https://blog.csdn.net/yuanhui0325/article/details/137722121

版权

代码相关专栏收录该内容

3 篇文章 0 订阅

订阅专栏

获取PyTorch模型的总参数量：

import torch
import torch.nn as nn

model = nn.Sequential(
    nn.Linear(784, 128),
    nn.ReLU(),
    nn.Linear(128, 10)
)

total_params = sum(p.numel() for p in model.parameters())
print(f"Total number of parameters: {total_params}")

查看每层的参数

获取每个层的参数量：

for name, parameter in model.named_parameters():
    print(f"{name}: {parameter.numel()}")

查看当前GPU内存使用

# 当前分配的总内存
current_memory = torch.cuda.memory_allocated()
print(f"Current memory allocated: {current_memory} bytes")

# 峰值内存
peak_memory = torch.cuda.max_memory_allocated()
print(f"Peak memory allocated: {peak_memory} bytes")

优化和释放内存

删除不再需要的变量

x = torch.randn(1000, 1000, device="cuda")
y = torch.randn(1000, 1000, device="cuda")
z = x + y

del x, y
torch.cuda.empty_cache()  # 清空未使用的缓存

使用`torch.no_grad()`

在进行推理或任何不需要计算梯度的前向传播时，使用torch.no_grad()来减少内存使用：

with torch.no_grad():
    output = model(input)

原地操作

尽可能使用原地操作，减少内存分配：

x = torch.randn(1000, 1000, device="cuda")
x.add_(1)  # 原地加1

清空CUDA缓存

在确定某些内存不再被需要后，可以清空CUDA缓存：

torch.cuda.empty_cache()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yuanhui0325

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch内存与参数管理笔记

在进行推理或任何不需要计算梯度的前向传播时，使用。
复制链接

扫一扫

专栏目录

Pytorch高效降低内存 torch.utils.checkpoint()的使用

flyingluohaipeng的博客

02-23

5932

该技术的核心是一种使用时间换空间的策略。在训练的前向传播中不保留中间激活值，从而节省下内存，并在反向传播中重新计算相关值，以此来执行一个高效的内存管理。主要用于节省训练模型过程中使用的内存，将模型或其部分的激活值的计算方法保存为一个checkpoint，在前向传播中不保留激活值，而在反向传播中根据checkpoint重新计算一次获得激活值用于反向传播。checkpoint操作是通过将计算交换为内存而起作用的。不同于常规地将整个计算图的所有中间激活值保存下来用于计算反向传播，作为检查点的部分不再保存中间激活值

[Linux/pytorch] 内存机制的记录

THE XING

06-22

454

pytorch 深度学习环境下接触到的几个内存概念。

参与评论您还未登录，请先登录后发表或查看评论

计算 Python 代码的内存和模型显存消耗的小技巧

deephub

12-18

4925

了解Python代码的内存消耗是每一个开发人员都必须要解决的问题，这个问题不仅在我们使用pandas读取和处理CSV文件的时候非常重要，在我们使用GPU训练的时候还需要规划GPU的内存使用。尤其是我们在白嫖使用kaggle和colab时显得更为重要。本篇文章我们将介绍两个 Python 库 memory_profiler和Pytorch-Memory-Utils这两个库可以帮助我们了解内存和显存的消耗。 memory_profiler pip install memory_profiler#Load it

pytorch GPU内存管理

码到功成的博客

01-06

1万+

1、PyTorch 提供了 memory_allocated() 和 max_memory_allocated() 用于监视 tensors 占用的内存； memory_cached() 和 max_memory_cached() 用于监视缓存分配器所管理的内存. 2、PyTorch 提供了 empty_cache() l来释放所有未使用的缓存的内存，以便其它 GPU 应用能够使用. 但是，并不能释放 tensors 所占用的 GPU 显存，因此，其并不能增加 PyTorch 的可用 GPU 显存量. py

一文读懂 PyTorch 显存管理机制

数据派THU

06-15

678

来源：数据STUDIO 本文约3600字，建议阅读9分钟为什么报错信息里提示显存够，但还是遇到了 OOM？显存的多级分配机制是怎样的？为什么要这样设计？剖析 PyTorch 显存管理机制主要是为了减少「显存碎片化」带来的影响。一个简单示例为：如上图所示，假设当前想分配 800MB 显存，虽然空闲的总显存有 1000MB，但是上方图的空闲显存由地址不连续的两个 500MB 的块组成，不够分配这 80...

pytorch张量索引切片等学习笔记

09-09

本笔记将深入探讨PyTorch中的张量、索引、切片以及与NumPy之间的转换，帮助你更好地理解和运用这个强大的深度学习库。一、PyTorch张量 1. 创建张量：可以通过各种方式创建张量，如`torch.tensor()`、`torch.zeros...

pytorch-CNN-dht11温湿度传感器笔记

05-09

在本项目"pytorch-CNN-dht11温湿度传感器笔记"中，我们将探讨如何使用PyTorch构建一个卷积神经网络（CNN）来处理来自DHT11温湿度传感器的数据。DHT11是一种常见的单总线数字温度和湿度传感器，广泛应用于各种嵌入式...

学习笔记(b站视频)PyTorch深度学习快速入门教程（绝对通俗易懂！）小土堆

热门推荐

小小码农的博客

06-14

10万+

本文是整理了大神的两篇博客：如何计算模型以及中间变量的显存占用大小：https://oldpan.me/archives/how-to-calculate-gpu-memory如何在Pytorch中精细化利用显存：https://oldpan.me/archives/how-to-use-memory-pytorch还有知乎中大神的解答：https://zhuanlan.zhihu.com/p/3...

pytorch对于CUDA的内存管理机制

weixin_39326879的博客

05-15

5067

1.设备分配 torch.cuda 用于设置和运行 CUDA 操作。它会跟踪当前选定的GPU，并且您分配的所有CUDA张量将默认在该设备上创建。所选设备可以使用 torch.cuda.device 环境管理器进行更改。一旦分配了张量，您就可以对其执行操作而必在意所选的设备如何，并且结果将总是与张量一起放置在相同的设备上。默认的情况下不允许进行交叉 GPU 操作，除了 copy_() 和其他具有类似复制功能的方法(如 to() 和 cuda() )之外。除非启用端到端的存储器访问，否则任何尝试将张量分配到

pytorch--How to free CPU RAM after `module.to(cuda_device)`?

The space of Shining

01-17

1054

How to free CPU RAM after module.to(cuda_device)? 大家在使用pytorch的时候，可能会发现一个问题，就是呢，我们使用module.to(cuda_device) 语句后，模型转到了gpu，显存增长了但是同样内存也增长了，一般不管网络多大，最少涨2G。我在lenet测试了，在maskrcnn-benchmark项目均测试过，效果都是这样子。这...

pytorch学习笔记（三）：自动求导

Keith

03-27

2万+

本片博文主要是对http://pytorch.org/docs/notes/autograd.html的部分翻译以及自己的理解，如有错误，欢迎指正！ Backward过程中排除子图 pytorch的BP过程是由一个函数决定的，loss.backward()，可以看到backward()函数里并没有传要求谁的梯度。那么我们可以大胆猜测，在BP的过程中，pytorch是将所有影响loss的Var...

Pytorch有什么节省内存（显存）的小技巧？

涛哥聊Python

10-13

662

编辑：忆臻https://www.zhihu.com/question/274635237本文仅作为学术交流分享，如果侵权，会删文处理笔者在知乎上发现了一个叫“Pytor...

pytorch increasing cuda memory OOM 问题

learning notes

12-01

5015

改了点model 的计算方式，然后就 OOM 了，调小了 batch_size,然后发现发现是模型每次迭代都会动态增长 CUDA MEMORY, 在排除了 python code 中的潜在内存溢出问题之后，基本可以把问题定在 pytorch 的图计算问题上了，说明每次迭代都重新生成了一张计算图，然后都保存着在，就 OOM 了。参考 CUDA memory continuously increases

pytorch内存泄露

09-24

PyTorch内存泄漏是指在PyTorch训练过程中，内存占用量逐渐增加，可能最终导致系统内核将其杀死。有几个可能的原因导致PyTorch内存泄漏： 1. 在训练循环中创建和销毁JIT模块时未及时释放内存。 2. loss求和未使用item()方法，导致内存泄漏。 3. num_workers设置过大导致大量使用list转换为tensor，进而产生内存泄漏。 4. 在dataset中的getitem函数中调用了加载的大型变量时，可能会导致内存泄漏。解决PyTorch内存泄漏的方法有： 1. 使用PyTorch 1.6版本，该版本已经修复了一些内存泄漏问题。 2. 在训练循环中，正确创建和销毁JIT模块，以避免内存泄漏。 3. 在loss求和时，使用item()方法，确保内存正确释放。 4. 适度调整num_workers参数，避免过多使用list转换为tensor，以减少内存占用。 5. 在dataset中的getitem函数中，避免调用大型变量，或者将大型变量转换为numpy类型，以解决内存泄漏问题。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交