跟着GPT学习——神经网络前备知识：PyTorch中如何节省内存

最新推荐文章于 2024-07-13 00:52:38 发布

DarcyInCode

最新推荐文章于 2024-07-13 00:52:38 发布

阅读量663

点赞数 22

分类专栏：跟着GPT学习-AI系列文章标签： gpt 学习神经网络

本文链接：https://blog.csdn.net/weixin_44465920/article/details/140036960

版权

跟着GPT学习-AI系列专栏收录该内容

10 篇文章 0 订阅

订阅专栏

我觉得GPT老师的语言功底比大多数的博客主要好（包括我自己），阅读起来更易理解，而且哪里不明白还可以直接问gpt老师，孜孜不倦，尽心尽责，全天待命，究极贴心。有这么厉害的一个老师，不学习简直暴殄天物。

于是乎我准备立一个flag，挑战跟着GPT老师学习365天，每天我都会整理自己的学习心得和脉络（文字大部分都是GPT直接生成的，我觉得比我自己写肯定好多了）感谢gpt老师！跪谢

全系列文章：跟着GPT学习-AI系列

PyTorch中节省内存

在程序运行时，操作变量可能会导致额外的内存分配。例如，当我们进行变量赋值操作时，如果不注意，可能会创建新的变量副本，从而占用更多内存。不同的框架处理这类问题的方式有所不同。

首先，以PyTorch为例：

before = id(Y)
Y = Y + X
id(Y) == before

这段代码用来检查变量Y在执行操作前后的内存地址是否相同。结果为False，这意味着执行操作后，Y指向了一个新的内存位置。原因有两个：

避免不必要的内存分配：频繁的内存分配和释放会降低性能，尤其是在处理大型数据时。
内存共享和副本的管理：当变量指向相同的内存位置时，任何一处的修改都会影响到其他引用了这个位置的变量。为了避免这种情况，通常会创建新的内存空间来存储结果。

为了演示如何节省内存，下面的代码使用torch.zeros_like函数预先分配内存，然后在同一内存位置上更新值：

z = torch.zeros_like(Y)
print('id(Y):', id(Y))
print('id(z):', id(z))
z[:] = Y + X
print('id(z):', id(z))

在这个例子中，id(z)在更新前后保持不变，这意味着没有新的内存分配，数据被更新在了原有的内存位置上。

如果我们希望在操作中避免创建新的变量而直接更新原有变量，可以使用如下方式：

before = id(X)
X += Y
id(X) == before

这里使用+=操作符直接在原位置上进行更新，结果为True，说明内存地址未变。

当然可以！让我们深入探讨更多关于内存管理和优化的相关知识，特别是在深度学习和计算机编程中如何有效管理内存。

📘 深入讨论：内存管理和优化

1. 深度学习框架中的内存管理

在深度学习框架中，如PyTorch、TensorFlow等，内存管理是一个关键问题。以下是一些最佳实践和技术：

1.1. PyTorch中的内存管理

内存共享：
PyTorch默认使用内存共享机制。通过torch.Tensor，我们可以创建一个新的视图而不进行内存复制，这样可以节省内存：
```
z = x.view(-1, 3, 224, 224)
```
避免不必要的内存分配：
使用torch.no_grad()上下文管理器可以在训练过程中禁用梯度计算，从而减少内存使用：
```
with torch.no_grad():
    output = model(input)
```
内存清理：
使用torch.cuda.empty_cache()清理未使用的缓存内存，特别是在使用GPU时：
```
import torch
torch.cuda.empty_cache()
```

1.2. TensorFlow中的内存管理

内存分配和回收：
TensorFlow的tf.config模块允许用户配置内存分配策略，例如限制GPU内存使用量：

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    try:
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
    except RuntimeError as e:
        print(e)

使用tf.function优化计算图：
使用tf.function将Python函数转换为TensorFlow计算图，减少内存分配开销：

@tf.function
def train_step(inputs):
    with tf.GradientTape() as tape:
        predictions = model(inputs)
        loss = loss_fn(labels, predictions)
    gradients = tape.gradient(loss, model.trainable_variables)
    optimizer.apply_gradients(zip(gradients, model.trainable_variables))

2. 高效的内存管理技术

2.1. 共享内存与内存池

共享内存：
在多线程或分布式计算中，使用共享内存可以提高数据的传输效率和减少内存占用。Python中的multiprocessing模块支持共享内存：
```
from multiprocessing import shared_memory
shm = shared_memory.SharedMemory(create=True, size=1024)
```
内存池：
内存池是一种管理内存分配的技术，通过预分配一定的内存块来减少内存分配的开销。例如，Python的memory_profiler库可以帮助跟踪内存使用情况：
```
from memory_profiler import profile

@profile
def my_func():
    a = [i for i in range(100000)]
    return sum(a)
```

2.2. 数组和张量的优化

NumPy数组优化：
使用numpy的dtype指定数据类型可以减少内存使用：
```
import numpy as np
a = np.zeros((1000, 1000), dtype=np.float32)
```
PyTorch张量的内存优化：
在PyTorch中，使用torch.float16或torch.bfloat16数据类型可以减少内存占用：
```
tensor = torch.randn(1000, 1000, dtype=torch.float16)
```

3. 实践中的案例研究

3.1. 迁移学习中的内存管理

在迁移学习中，合理管理内存至关重要。以下是一些策略：

冻结部分层：
在迁移学习中，冻结模型的部分层以减少内存占用和计算量：
```
for param in model.features.parameters():
    param.requires_grad = False
```
动态调整批大小：
根据GPU内存使用情况动态调整批大小，确保训练过程中的内存使用在可接受范围内。

3.2. 分布式训练中的内存优化

在分布式训练中，内存管理变得更加复杂。以下是一些优化策略：

使用分布式数据并行：
使用torch.nn.DataParallel或torch.distributed实现数据并行，以充分利用多个GPU：
```
model = torch.nn.DataParallel(model)
```

梯度累积：
在内存受限的情况下，使用梯度累积技术减少内存使用：

for batch in dataloader:
    inputs, labels = batch
    with torch.cuda.amp.autocast():
        outputs = model(inputs)
        loss = criterion(outputs, labels)
    scaler.scale(loss).backward()
    if batch_idx % accumulate_steps == 0:
        scaler.step(optimizer)
        scaler.update()

此文章会在学习的过程中不断持续更新

DarcyInCode

关注

22
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
跟着GPT学习——神经网络前备知识：PyTorch中如何节省内存

我觉得GPT老师的语言功底比大多数的博客主要好（包括我自己），阅读起来更易理解，而且哪里不明白还可以直接问gpt老师，孜孜不倦，尽心尽责，全天待命，究极贴心。有这么厉害的一个老师，不学习简直暴殄天物。跪谢。
复制链接

扫一扫

专栏目录