tensorflow使用GPU训练时的显存占用问题

最新推荐文章于 2024-07-04 11:46:18 发布

sunwuhuang1

最新推荐文章于 2024-07-04 11:46:18 发布

阅读量6.4w

点赞数 18

分类专栏：机器学习

本文链接：https://blog.csdn.net/sunwuhuang1/article/details/53946462

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

最近用GoogleNet （inception-v3）做fine-tune训练时，遇到了一个问题。当我选择单个GPU训练时候，服务器中所有的GPU显存都会被占满，如下图所示：

出现以上问题的原因是tensorflow在训练时默认占用所有GPU的显存。

可以通过以下方式解决该问题：

1、在构造tf.Session()时候通过传递tf.GPUOptions作为可选配置参数的一部分来显式地指定需要分配的显存比例，如下所示：

# 假如有12GB的显存并使用其中的4GB:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

per_process_gpu_memory_fraction指定了每个GPU进程中使用显存的上限，但它只能均匀作用于所有GPU，无法对不同GPU设置不同的上限

2、尝试如下设置：

config = tf.ConfigProto()
config.gpu_options.allow_growth=True
sess = tf.Session(config=config)

当allow_growth设置为True时，分配器将不会指定所有的GPU内存，而是根据需求增长

3、在执行训练脚本前使用：

export CUDA_VISIBLE_DEVICES=1

来限制可见的GPU数目

sunwuhuang1

关注

18
点赞
踩
56

收藏

觉得还不错? 一键收藏
19
评论
tensorflow使用GPU训练时的显存占用问题

最近用GoogleNet （inception-v3）做fine-tune训练时，遇到了一个问题。当我选择单个GPU训练时候，服务器中所有的GPU显存都会被占满，如下图所示：出现以上问题的原因是tensorflow在训练时默认占用所有GPU的显存。可以通过以下方式解决该问题：1、在构造tf.Session()时候通过传递tf.GPUOptions作为可选配置参数
复制链接

扫一扫

专栏目录