【工程应用】TensorFlow的单机训练与分布式训练模式

CC‘s World

已于 2022-05-18 13:37:14 修改

阅读量454

点赞数

分类专栏：工程应用文章标签： tensorflow 分布式人工智能

于 2022-05-09 12:00:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36643449/article/details/124662958

版权

工程应用专栏收录该内容

7 篇文章 0 订阅

订阅专栏

TensorFlow的计算平台也分为两种不同的模式，一种是单机训练，另一种是多机分布式训练。

对单机训练来说，虽然执行过程中也包括CPU、GPU的并行计算过程，但总体上处于共享内存的环境，不用过多考虑通信的问题；

而多机分布式训练指的是多台不共享内存的独立节点组成的集群环境下的训练方法。计算节点间需要依靠网络通信，因此可以认为这是与Parameter Server相似的计算环境。

TensorFlow的单机训练是在一个worker节点上进行的，单worker节点内部按照任务关系图的方式在不同GPU+CPU节点间进行计算；对分布式环境来说，平台存在多worker节点，如果采用TensorFlow的Parameter Server策略(tf.disrtibute.experimental.ParameterServerStrategy)，则各worker节点会以数据并行的方式进行训练。也就是说，各worker节点以同样的任务关系图的方式进行训练，但训练数据不通，产生的梯度以Parameter Server的方式汇总更新。

接下来介绍每个worker节点内部CPU和GPU的具体任务分工。GPU拥有多核优势，因此在处理矩阵加、向量乘等张量运算时，相比于CPU拥有巨大优势。在处理一个任务节点或任务子图时，CPU主要负责数据和任务的调度，而GPU则负责计算密集度高的张量运算。

举例来说，在处理两个向量的元素乘操作时，CPU会居中调度，把两个向量对应范围的元素发送给GPU处理，再手机处理结果，最终生成处理好的结果向量。从这个角度讲，CPU+GPU的组合也像是一个简化版的“Parameter Server”。

参考资料：
深度学习推荐系统王喆编著中国工信出版集团

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【工程应用】TensorFlow的单机训练与分布式训练模式

TensorFlow的计算平台也分为两种不同的模式，一种是单机训练，另一种是多机分布式训练。对单机训练来说，虽然执行过程中也包括CPU、GPU的并行计算过程，但总体上处于共享内存的环境，不用过多考虑通信的问题；而多机分布式训练指的是多台不共享内存的独立节点组成的集群环境下的训练方法。计算节点间需要依靠网络通信，因此可以认为这是与Parameter Server相似的计算环境。TensorFlow的单机训练是在一个worker节点上进行的，单worker节点内部按照任务关系图的方式在不同GPU+CPU节
复制链接

扫一扫

专栏目录

CC‘s World CSDN认证博客专家 CSDN认证企业博客

码龄8年

280: 原创

22万+: 周排名

185万+: 总排名

26万+: 访问

: 等级

3402: 积分

113: 粉丝

133: 获赞

42: 评论

849: 收藏

私信

关注

热门文章

分类专栏

Python 2篇
机器学习 27篇
广告系统 2篇
推荐系统学习 2篇
多模态 25篇
Keras 18篇
算法 11篇
计算机基础 9篇
工程应用 7篇
推荐算法 40篇
PySpark 9篇
C++ 14篇
论文阅读 4篇
TensorFlow 12篇
力扣 54篇
自然语言处理 5篇
MXNet 1篇
Pytorch 13篇
数据结构 2篇
剑指offer编程题 67篇
计算机视觉 1篇

最新评论

【算法】局部敏感哈希 LSH 的 Python 实现
不断生长: 想问一下，这个局部敏感哈希和位置敏感哈希(location sensitive hash)是一样的吗？
【算法】局部敏感哈希 LSH 的 Python 实现
柚子树cc: 后面两个minhash的验证应该使用Jaccard距离吧，找出来的topk明显不太对
【算法】局部敏感哈希 LSH 的 Python 实现
m0_56951613: 最近在学lsh，看了这篇文章有两个问题想问问博主 1、e2lsh不是需要L个哈希函数族，每族k个哈希函数吗，感觉你的代码里好像只有一个哈希函数族，不知道是不是我理解错了 2、经过lsh筛选后，只比较前20个数据的话确实看起来精确度很高，但我输出了candidates发现其实筛选后还有8，9000个数据，也就是说只排除了1000多个数据，我试过其他人的代码，但基本都有这个问题，要保证精确度的话筛选掉的数据量就会很小，想要筛选完的数据量小的话精确度就会很低，是这算法原本的目的就是在海量数据集里筛选掉一小部分的数据吗，还是调参没调好导致效果太差？
【计算机基础】github使用 & git命令
朗197: 帮助很大，非常感谢！！！
【论文阅读】Adaptive Mixtures of Local Experts
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。