配置分布式TensorFlow

最新推荐文章于 2019-08-10 21:09:06 发布

chengqiuming

最新推荐文章于 2019-08-10 21:09:06 发布

阅读量391

点赞数

分类专栏：人工智能文章标签：分布式TensorFlow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chengqiuming/article/details/80041664

版权

人工智能专栏收录该内容

91 篇文章 4 订阅

订阅专栏

在大型数据集上进行神经网络的训练，往往需要更大的运算资源，而且还要耗费若干天才能完成运算量。

TensorFlow提供了一个可以分布式部署的模式，将一个训练任务拆成多个小任务，分配到不同的计算机上来完成协同运算，这样使用计算机群来代替单机计算，可以使训练时间大大缩短。

一分布式TensorFlow的角色及原理

要想配置TensorFlow为分布训练，需要先了解TensorFlow中关于分布式的角色分配。

ps：作为分布式训练的服务端，等待各个终端（supervisors）来连接。
worker：在TensorFlow的代码中被称为supervisors，作为分布式训练的运算终端。
chief supervisors：在众多运算终端中必须选择一个作为主要的运算终端。该终端是在运算终端中最先启动的，它的功能是合并各个终端运算后的学习参数，将其保存或载入。

每个具体角色网络标识都是唯一的，即分布在不同IP的机器上（或者同一个机但不同的端口）。

在实际运行中，各个角色的网络构建部分代码必须100%的相同。三者分布如下：

服务端作为一个多方协调者，等待各个运算终端来连接。
chief supervisors会在启动时统一管理全局的学习参数，进行初始化或从模型载入。
其他的运算终端只是负责得到其对应的任务并进行计算，并不会保存检查点，也不会保存用于TensorBoad可视化的summary日志等任何参数信息。

整个过程都是通过RPC协议来通信的。

二分布式部署TensorFlow的具体方法

配置过程中，首先需要建立一个server，在server中会将ps及所有worker的IP端口准备好。接着，使用tf.train.Supervisor中的managed_session来管理一个打开的session.session中只负责运算，而通信协调的事情就都交给supervisor来管理了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
配置分布式TensorFlow

在大型数据集上进行神经网络的训练，往往需要更大的运算资源，而且还要耗费若干天才能完成运算量。TensorFlow提供了一个可以分布式部署的模式，将一个训练任务拆成多个小任务，分配到不同的计算机上来完成协同运算，这样使用计算机群来代替单机计算，可以使训练时间大大缩短。一分布式TensorFlow的角色及原理要想配置TensorFlow为分布训练，需要先了解TensorFlow中关于分布式的角色分配...
复制链接

扫一扫

专栏目录

chengqiuming CSDN认证博客专家 CSDN认证企业博客

码龄8年

6005: 原创

2万+: 周排名

145万+: 总排名

1140万+: 访问

: 等级

12万+: 积分

3716: 粉丝

3504: 获赞

1163: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++关于线程栈尺寸实战
hhhhhhhhhhkkkkkkkkkk: 静态数据区算是另类的堆空间，效果上相当于在main函数执行前先申请(malloc)静态数据区的空间。不随函数的退出而释放，行为与堆空间相似，区别是不能手动释放，所以也算是堆空间。
颜色的 HSL 表示
小明: 博主的文章细节很到位，兼顾实用性和可操作性，内容和细节都很到位，期待博主持续带来更多好文
JVM 垃圾回收之复制算法
hcfee: 对啊，不标记怎么确定对象是不是存活呢？看到好几个博客都写不需要标记，搞不懂
伪随机生成器具体实现——线性同余法
Eric-Xuan: 所以这个最好是让seed_value < lcg_m 来保证随机性
省市区三级联动 el-select 组件前端实现
Keep___Promise: 报错了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。