tensorflow2.x学习笔记十二：使用多GPU训练模型

最新推荐文章于 2024-05-19 08:28:05 发布

耐心的小黑

最新推荐文章于 2024-05-19 08:28:05 发布

阅读量3.9k

点赞数 2

分类专栏： # TensorFlow2.x学习笔记文章标签： tensorflow 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39507748/article/details/108303217

版权

TensorFlow2.x学习笔记专栏收录该内容

31 篇文章 39 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

一、前言

如果使用多GPU训练模型，推荐使用内置fit方法，较为方便，仅需添加2行代码。

MirroredStrategy过程简介：

训练开始前，该策略在所有 N 个计算设备上均各复制一份完整的模型；
每次训练传入一个批次的数据时，将数据分成 N 份，分别传入 N 个计算设备（即数据并行）；
N 个计算设备使用本地变量（镜像变量）分别计算自己所获得的部分数据的梯度；
使用分布式计算的 All-reduce操作，在计算设备间高效交换梯度数据并进行求和，使得最终每个设备都有了所有设备的梯度之和；
使用梯度求和的结果更新本地变量（镜像变量）；
当所有设备均更新本地变量后，进行下一轮训练（即该并行策略是同步的）。

首选说明一下，我们在下面会使用两个逻辑GPU来模拟多GPU

import tensorflow as tf
print(tf.__version__)
from

了解本专栏

超级会员免费看

耐心的小黑

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
tensorflow2.x学习笔记十二：使用多GPU训练模型

一、前言如果使用多GPU训练模型，推荐使用内置fit方法，较为方便，仅需添加2行代码。MirroredStrategy过程简介：训练开始前，该策略在所有 N 个计算设备上均各复制一份完整的模型；每次训练传入一个批次的数据时，将数据分成 N 份，分别传入 N 个计算设备（即数据并行）；N 个计算设备使用本地变量（镜像变量）分别计算自己所获得的部分数据的梯度；使用分布式计算的 All-reduce操作，在计算设备间高效交换梯度数据并进行求和，使得最终每个设备都有了所有设备的梯度之和；使用梯度求和
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

耐心的小黑 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。