tensorflow 动态分配内存以及设置使用那块gpu的方法

最新推荐文章于 2025-04-22 17:02:44 发布

原创最新推荐文章于 2025-04-22 17:02:44 发布

· 1w 阅读

12 ·

版权

tensorflow 同时被 2 个专栏收录

7 篇文章

订阅专栏

deeplearning

7 篇文章

订阅专栏

本文介绍了如何在TensorFlow中配置GPU内存使用策略，包括通过设置`allow_growth`选项实现按需分配内存，避免内存碎片问题；以及通过`per_process_gpu_memory_fraction`参数限定进程占用的GPU内存比例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

动态内存

config = tf.ConfigProto()  
config.gpu_options.allow_growth=True  
sess = tf.Session(config=config)

如何控制GPU资源率


（参考：http://blog.csdn.net/u012436149/article/details/53837651）

allow growth

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config, ...)
使用allow_growth option，刚一开始分配少量的GPU容量，然后按需慢慢的增加，由于不会释放内存，所以会导致碎片
per_process_gpu_memory_fraction

gpu_options=tf.GPUOptions(per_process_gpu_memory_fraction=0.7)
config=tf.ConfigProto(gpu_options=gpu_options)
session = tf.Session(config=config, ...)
设置每个GPU应该拿出多少容量给进程使用，0.4代表 40%

控制使用哪块GPU卡

控制方式
~/ CUDA_VISIBLE_DEVICES=0  python your.py#使用GPU0
~/ CUDA_VISIBLE_DEVICES=0,1 python your.py#使用GPU0,1
注意单词不要打错

reference

http://blog.csdn.net/sunwuhuang1/article/details/53946462

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

tech_chenlongzhen

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Tensorflow2对GPU内存的分配策略

无风听海

08-10

1429

一、问题源起从以下的异常堆栈可以看到是BLAS程序集初始化失败，可以看到是执行MatMul的时候发生的异常，基本可以断定可能数据集太大导致memory不够用了。 2021-08-10 16:38:04.917501: E tensorflow/stream_executor/cuda/cuda_blas.cc:226] failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED 2021-08-10 16:38:04.960048: E te

tensorflow的显存分配机制

2303_77224751的博客

09-22

514

默认情况下，TensorFlow 会映射进程可见的所有 GPU（取决于 CUDA_VISIBLE_DEVICES）的几乎全部内存。这是为了减少内存碎片，更有效地利用设备上相对宝贵的 GPU 内存资源。为了将 TensorFlow 限制为使用一组特定的 GPU，可以使用 tf.config.set_visible_devices 方法。在某些情况下，希望进程最好只分配可用内存的一个子集，或者仅在进程需要时才增加内存使用量。TensorFlow 为此提供了两种控制方法。

参与评论您还未登录，请先登录后发表或查看评论

Tensorflow,Keras使用动态显存分配

qi_sama的博客

12-15

2294

Tensorflow,Keras使用动态显存分配使用tf，keras训练时常常占满显存，因此采用动态显存分配策略节约资源 import tensorflow as tf #这里如果用到tf2版本，则替换为> import tensorflow.compat.v1 as tf config = tf.ConfigProto() config.gpu_options.allow_growth=True sess = tf.Session(config=config) ...

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

最新发布

数据派THU

04-22

此外由于PyTorch的CPU执行通常先于GPU执行，缓存分配器通过其池化机制提前准备内存资源，有助于隐藏执行过程中可能出现的延迟，进一步优化整体性能。分析第2至第4步可以发现，它们的内存使用模式高度相似——首先在前向传播过程中激活值内存占用快速增加，随后在反向传播过程中进行梯度累积，同时随着反向传播的进行，用于计算梯度的激活值存储逐步释放。在第一步中，分配器初始化并预分配了内存块，为后续计算步骤提供加速，使之后的操作无需重复寻找空闲内存区域。在处理GPU内存问题时，精确了解内存使用状况至关重要。

tensorflow指定GPU与动态分配GPU memory

sherry_颖的博客

03-15

4098

在tensorflow中，默认指定占用所有的GPU，如需指定占用的GPU，可以在命令行中：export CUDA_VISIBLE_DEVICES=1这样便是只占用1号GPU，通过命令nvidia-smi可以查看各个GPU的使用情况。另外，也可以在python程序中指定GPU，并且动态分配memory，代码如下import os import sys os.environ['CUDA_VISIBLE...

深度学习 | TensorFlow 2.x 和 1.x 限制显存（超详细）

HinGwenWoong的博客

11-30

7591

深度学习 | TensorFlow 2.x 和 1.x 限制显存（超详细）部署深度学习服务的时候，往往不是让其吃满一整张卡，而且有时候会出现致命的 OOM （Out of Memory）错误，这就需要适当限制下显存，下面介绍下如何使用代码限制显存。

[tf] config.gpu_options.allow_growth=True

weixin_43742643的博客

11-22

6026

默认开启 Tensorflow 的 session 之后，就会占用几乎所有的显存，这样的话速度会比较快。使用allow_growth option，刚一开始分配少量的GPU容量，然后按需慢慢的增加，由于不会释放内存，所以会导致碎片。 config = tf.ConfigProto() config.gpu_options.allow_growth = True set_session(tf.Session(config=config)) ...

tensorflow指定GPU与动态分配GPU memory设置

12-20

本文将深入探讨如何在TensorFlow中指定使用特定GPU以及如何动态分配GPU内存。首先，当我们运行TensorFlow程序时，如果不做任何设置，它会默认使用所有可用的GPU。如果想指定只使用某个GPU，可以通过环境变量`CUDA_...

在tensorflow中设置使用某一块GPU、多GPU、CPU的操作

12-20

以下将详细解释如何在TensorFlow中设置使用特定GPU、多GPU以及仅使用CPU。首先，如果你想要指定使用某一块GPU，例如GPU编号为1，可以使用以下代码： ```python import os os.environ["CUDA_DEVICE_ORDER"] = "PCI...

tensorflow:指定gpu 限制使用量百分比,设置最小使用量的实现

09-18

另外，你可能希望让TensorFlow根据需要动态分配GPU内存，而不是一开始就预分配所有内存。这种情况下，可以启用 `allow_growth` 选项： ```python config = tf.ConfigProto() config.gpu_options.allow_growth = ...

tf.ConfigProto()详解

Jq的博客

02-21

7867

tf.ConfigProto()主要的作用是配置tf.Session的运算方式，比如gpu运算或者cpu运算参数：参数作用 log_device_placement 是否打印设备分配日志 inter_op_parallelism_threads 设置线程一个操作内部并行运算的线程数，比如矩阵乘法，如果设置为０，则表示以最优的线程数处理 intra_op_parallelism_threads 设置多个操作并行运算的线程数，比如 c = a + b，d = e + f . 可以并

allow_growth控制tensorflow显存动态增长无效问题

豆芽菜

09-10

2794

问题：tensorflow1.15环境使用config.gpu_options.allow_growth = True，控制显存动态增长，发现无效，显存仍然会被完全占用 config = tf.ConfigProto() config.gpu_options.allow_growth = True tf.keras.backend.set_session(tf.Session(config=config)) 分析：暂未找到原因，类似问题：gpu_options doesn't work · Issue

Tensorflow的GPU分配方法

looknm的专栏

08-03

2022

Tensorflow、多个GPU

tensorflow中使用GPU的设置方法

weixin_41012399的博客

07-03

2万+

方法一： Config=tf.ConfigProto(allow_soft_placement=True) ##:如果你指定的设备不存在,允许TF自动分配设备 Config.gpu_options.allow_growth=True ##动态分配内存 sess=tf.session(config=config) 方法二： gpu_options = tf.GPUOptions(allow_g...

Tensorflow中的内存分配

weixin_42721176的博客

06-07

1345

Tensorflow系统复杂，支持平台多，各类数据结构也多，所以设计一个统一的内存管理分配接口很重要。本文主要探讨tensorflow中的内存分配的相关机制，会重点研究其中实现的两种分配算法。内存分配是系统中非常重要的一环，大家平常接触最多的就是malloc(new)和free(delete)。也就是分配和施放，在tensorflow中也是这样。Tensorflow提供了一个公共的接口类，Allocator类，该类提供了两个重要的方法： AllocateRaw分配内存，DeallocateRaw施

tensorflow使用GPU训练时的显存占用问题

热门推荐

sunwuhuang1的博客

12-30

6万+

最近用GoogleNet （inception-v3）做fine-tune训练时，遇到了一个问题。当我选择单个GPU训练时候，服务器中所有的GPU显存都会被占满，如下图所示：出现以上问题的原因是tensorflow在训练时默认占用所有GPU的显存。可以通过以下方式解决该问题： 1、在构造tf.Session()时候通过传递tf.GPUOptions作为可选配置参数

tensorflow2 设置显存按需增长

u014421914的博客

03-19

672

# 获取所有 GPU 设备列表 gpus = tf.config.experimental.list_physical_devices('GPU') if gpus: try: # 设置 GPU 显存占用为按需分配，增长式 for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True) except RuntimeError as e: # 异常处理 print(e) ...

Tensorflow2.0以上版本GPU使用

clownwai的博客

01-19

1834

项目场景：Docker+Gunicorn+flask+Tensorflow2.3.0使用单GPU加载双模型问题描述：如果单Tensorflow2.3.0使用GPU加载双模型出现out of memory 原因分析： tensorflow使用GPU时默认将整个GPU占满。解决方案： 1. from tensorflow.compat.v1 import ConfigProto from tensorflow.compat.v1 import InteractiveSession config

cuda核函数中动态分配显存

weixin_36709051的博客

01-07

3973

cuda核函数中动态分配显存 cuda在核函数kernel中是可调用cudaMalloc动态分配显存，不过该实现该功能需要设备具有动态并行的能力，即GPU的架构需要>sm_35。默认的nvcc编译方式选择的架构是sm_30，其不支持动态并行特性，如果在编译时不选择设备计算能力会报如下错误，即在核函数中无法调用主机调用函数。 calling a __host__ function("cu...

TensorFlow 内存分配

03-26

### TensorFlow 内存分配机制 TensorFlow 的内存分配机制主要涉及 GPU 和 CPU 上的资源管理。以下是关于 TensorFlow 内存分配的具体说明以及如何优化其性能。 #### 1. 默认内存分配行为 TensorFlow 在启动时，默认情况下会占用尽可能多的 GPU 显存，这种行为被称为“非动态增长模式”。这意味着如果系统中有足够的显存可用，则 TensorFlow 将尝试一次性占据大部分显存空间[^2]。这种方式虽然可以提高某些场景下的效率，但在实际应用中可能会导致其他程序无法正常访问剩余的显存资源。 #### 2. 动态增长模式配置为了更高效地利用 GPU 资源并减少不必要的冲突，可以通过设置 `allow_growth` 参数来启用动态增长模式。在这种模式下，TensorFlow 只会在真正需要的时候逐步增加所使用的显存量，而不是一开始就抢占全部可能的空间： ```python import tensorflow as tf gpus = tf.config.experimental.list_physical_devices('GPU') if gpus: try: for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True) except RuntimeError as e: print(e) ``` 上述代码片段展示了如何通过 Python API 配置每一块检测到的 GPU 设备进入允许增长状态。 #### 3. 手动限制最大可使用显存比例除了开启动态增长外，还可以进一步手动指定 TensorFlow 最大能够消耗的 GPU 卡百分比。这有助于更好地控制实验环境中的硬件资源共享情况： ```python from tensorflow.compat.v1 import ConfigProto from tensorflow.compat.v1 import InteractiveSession config = ConfigProto() config.gpu_options.per_process_gpu_memory_fraction = 0.4 # 设置为总显存容量的40% session = InteractiveSession(config=config) ``` 这里我们将单进程所能获取的最大 GPU 显存设定为其总量的百分之四十作为例子演示[^4]。 #### 4. 切换至仅使用 CPU 运算当遇到特定任务不适合或者不需要依赖于图形处理器加速计算时，可以选择强制让整个模型训练过程完全基于中央处理器完成运算操作。这样做的好处是可以避免因频繁切换上下文带来的额外开销同时也简化调试流程: ```python with tf.device('/CPU:0'): ... ``` 只需简单地将目标节点包裹在一个带有 `/CPU:0` 标识符的选择器内部即可实现这一目的[^3]。 #### 5. 清理未被释放的缓存数据无论是处于哪种类型的设备之上，在结束一轮迭代之后都应该及时清除掉那些不再必要的临时变量从而腾出更多存储位置供后续阶段继续沿用下去。对于 PyTorch 用户来说可以直接调用 `.cuda().empty_cache()` 方法达成清理效果；而对于 TF 来讲则需借助外部工具比如 nvidia-smi 命令行指令来进行监控与调整。 --- ### 总结通过对 TensorFlow 提供的不同选项合理组合运用——包括但不限于激活动态扩展功能、定量约束上限额度以及必要时刻退回到纯软件层面处理事务等等措施相结合起来共同作用之下往往可以获得较为理想的综合表现成果出来。