Keras/pytorch在训练时指定gpu以及多gpu训练

最新推荐文章于 2024-07-23 14:52:41 发布

recusant

最新推荐文章于 2024-07-23 14:52:41 发布

阅读量5.6k

点赞数 3

分类专栏： Keras/tensorflow

本文链接：https://blog.csdn.net/weixin_38047275/article/details/86665019

版权

Keras/tensorflow 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

首先在终端输入命令nvidia-smi查看gpu运行状态

可见在服务器存在两台1080ti显卡，编号分别为0,1。在实际情况中选择一块无人使用的显卡进行训练最为合适。另外在训练过程中TensorFlow和Keras都是默认占满全部显存，多模型在一张卡训练时容易造成爆显存的情况，所以采用限制显存大小的方法。

import tensorflow as tf
import keras.backend.tensorflow_backend as KTF

config = tf.ConfigProto()
# 指定可见显卡
config.gpu_options.visible_device_list="1"
#不满显存, 自适应分配
config.gpu_options.allow_growth=True   
sess = tf.Session(config=config)
KTF.set_session(sess)

若要使用多块gpu训练，使用keras.utils.multi_gpu_model方法

在原来的model基础上使用multi_gpu_model函数指定一下gpu个数：

model =  multi_gpu_model(model, 2)

pytorch则是

if torch.cuda.device_count() > 1:
        model = nn.DataParallel(model)
model.to(device)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

recusant

关注关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【LLM】如何使用单个GPU 微调 Llama2

sikh_0529的博客

09-14

1983

自然语言处理领域通过 ChatGPT 等大型语言模型 (LLM) 取得了令人难以置信的进步。然而，这些模型都有其局限性。他们可能会提出隐私问题，遵守一套固定的规则，并仅限于最后一次培训的日期。PaLM 和 GPT-3.5 等预训练 LLM 的另一个限制不是。这意味着开发人员和研究人员无法访问模型的内部工作原理，从而限制了他们根据特定用例微调和定制模型的能力。幸运的是，新时代已经到来，是Meta推出的开源LLM，它允许，减轻隐私问题并实现个性化的AI体验。此外，创新的。

使用多GPU训练模型.md

04-06

`tf.distribute.MirroredStrategy`是一种分布式的训练策略，它可以在多台机器或单机多GPU环境下进行高效的模型训练。其核心思想是在训练开始前，将模型在所有参与计算的GPU上各复制一份；在每轮训练过程中，数据会被...

参与评论您还未登录，请先登录后发表或查看评论

Training Region-based Object Detectors with Online Hard Example Mining

weixin_36670529的博客

09-12

842

目录摘要 1、简介 3、R-CNN概述 3.1、训练 4、我们的方法 4.1、在线难样本挖掘 4.2、实现细节 5、对在线难样本挖掘进行分析 5.1、实验步骤 5.2、OHME和启发式抽样的比较 5.3、鲁棒梯度估计 5.4、什么时候可以使用所有的例子？ 5.5、更好的优化 5.6、计算损耗 6、PASCAL VOC和MS COCO的结果 6.1、VOC 2007...

Pytorch学习笔记——在GPU上进行训练

热门推荐

duzm200542901104的专栏

09-11

1万+

TrainingArguments是Hugging Face Transformers库中用于训练模型时需要用到的一组参数，用于控制训练的流程和效果。本文章详细列出了90个参数的解释，供大家选用

GPU多卡并行训练总结（以pytorch为例）

小白学视觉

04-13

2943

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达为什么要使用多GPU并行训练本简单来说，有两种原因：第一种是模型在一块GPU上放不下，两块或多块GPU上就能运行完整的模型（如早期的AlexNet）。第二种是多块GPU并行计算可以达到加速训练的效果。想要成为“炼丹大师“，多GPU并行训练是不可或缺的技能。常见的多GPU训练方法：1.模型并行方式：如果模型特别大，GPU显存不够，...

Hugging Face的TrainingArguments常用参数学习

pumpkin84514的博客

05-22

833

output_dir: 确保模型和结果保存位置。: 影响内存使用和训练速度。: 决定训练时长和模型的收敛程度。: 学习率，影响模型的学习速度和性能。: 正则化，防止过拟合。: 确保模型在训练过程中的监控和评估。fp16: 使用混合精度可以提高训练速度并减少内存占用，但需要兼容的硬件。通过合理配置这些参数，可以更好地控制模型训练过程，提高训练效率和模型性能。

PyTorch在AI&GPU并行计算集群上部署与使用.docx

07-10

在很多性能测试中，PyTorch的表现优于TensorFlow和Keras等框架。这种速度优势对于大规模训练任务尤为重要。 3. **易用性**：PyTorch采用了优雅的面向对象设计，使得开发者能够更加专注于实现自己的想法，而不是...

Keras vs Pytorch for Deep Learning

06-26

在编码风格上，PyTorch介于Keras和TensorFlow之间，提供了比Keras更多的灵活性和控制，同时又不需要进行任何复杂的声明式编程。在深度学习的实践中，专家们经常在Keras和PyTorch之间摇摆不定，而且通常这取决于...

jupyter notebook 调用环境中的Keras或者pytorch教程

12-20

然而，当我们在不同的 Python 环境（如虚拟环境或 conda 环境）中安装了特定版本的库（如 Keras 或 PyTorch）时，我们可能希望在 Jupyter Notebook 中直接使用这些环境中的库。下面是如何在 Jupyter Notebook 中调用...

理解情感—从Keras移植到pyTorch

01-27

这涉及到理解两框架的权重存储和初始化方式，以及如何在pyTorch中实现Keras的初始化策略。在torchMoji/DeepMoji模型中，作者成功地将一个在大规模数据集上预训练的模型从Keras迁移到pyTorch。这个模型由双LSTM层、...

【学习总结】Python transformers TrainingArguments 重要参数说明

weixin_40378209的博客

03-14

1666

Python transformers TrainingArguments 15个重要参数说明

TrainingArguments 报错，降低transformers版本即可解决

jieshenai的博客

06-14

2245

TrainingArguments 报错，降低transformers版本即可解决

NLP文档挖宝(3)——能够快速设计参数的TrainingArguments类

天才小呵呵的博客

05-29

7826

整个任务中的调参“源泉”就是这个TrainingArguments类，这个类是使用dataclass装饰器进行包装，然后再利用HfArgumentParser进行参数的解析，最后获得了对应的内容。这个包可以调的参数有很多，有用的也有很多，所以还是有必要一起看一下的。

【多GPU训练】选择服务器中部分指定GPU进行使用

qq_45193872的博客

01-26

9313

使用背景：主机多GPU情况下选择指定部分GPU使用很多服务器在进行配备时会装配多块GPU，那么我们在使用服务器时，有时可能会多个终端对服务器进行操控，因此有时需要对特定的GPU进行指定操作，才不会使用户之间使用GPU时相互影响；或者需要指定特定数量的GPU才能达到训练效果。

huggingface 笔记：查看GPU占用情况

qq_40206371的博客

05-20

507

为了打印GPU利用率和使用Trainer进行训练运行的摘要统计信息，定义了两个辅助函数。在我这边的GPU上跑不起来：可能是不同版本的cuda、pytorch导致的（不确定）

keras深度训练:GPU设置

qq_38410428的博客

06-27

6340

keras指定运行时显卡及限制GPU用量固定GPU训练： import os import tensorflow as tf import keras.backend.tensorflow_backend as KTF #进行配置，每个GPU使用90%上限现存 os.environ["CUDA_VISIBLE_DEVICES"]="0,1" # 使用编号为0，1号的GPU config = t...

利用GPU训练的配置方法（Keras）

max

09-21

2674

利用GPU训练的配置方法（Keras）使用GPU配置合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入本文主要针对Keras（Tensorflow2.0版本以后）深度学习框架如何对GPU进行配置，以及如何设置训练任务对GPU的占有率。使用G

Keras使用GPU训练

qq_41982466的博客

06-22

9761

TensorFlow、Keras与GPU之间的版本对应版本问题—keras和tensorflow的版本对应关系 tensorflow各个版本与cuda版本的对应关系~最新环境部署中cuda对应的tensorflow-gpu、keras版本、pytorch的对应版本使用GPU训练Keras模型 Keras——检查GPU是否可用如何使用GPU训练keras模型 ...