linkedin开源列表_LinkedIn开源了在Hadoop上运行TensorFlow的工具

linkedin开源列表

LinkedIn已使用Hadoop中的YARN(Yet Another Resource Negotiator)作业调度系统开源了一个用于扩展和管理TensorFlow中的深度学习作业的项目。

Tony项目是在LinkedIn尝试使用两个现有的开源解决方案在Hadoop上运行计划的TensorFlow作业并发现他们都想要的之后才出现的。 已经有一些在Hadoop上运行TensorFlow的项目,但是LinkedIn对它们不满意。 其中之一, Spark上的TensorFlow通过Apache Spark的作业引擎运行TensorFlow,但它与Spark的联系太紧密了。 另一个TensorFlowOnYARN提供与Tony相同的基本功能,但未维护且不提供容错功能。

[ TensorFlow机器学习入门 TensorFlow评论:最好的深度学习库变得更好 •查看最新版本的TensorFlow中的新增功能 | 通过InfoWorld的App Dev Report新闻通讯了解编程方面的热门话题。 ]

TensorFlow中的深度学习模型需要某种形式的作业管理。 训练模型可能需要数小时或数天,并且训练过程需要一定的保证才能正确完成。

根据LinkedIn的新闻记录,Tony使用YARN的资源和任务调度系统在整个Hadoop集群上设置TensorFlow作业。 Tony还可以通过Hadoop调度基于GPU的TensorFlow作业,请求不同类型的资源(GPU与CPU)或为TensorFlow节点分配不同的内存,并确保作业输出定期保存到HDFS并从它们停止的地方恢复崩溃或被打断。

Tony将其工作分为三个内部组件:一个客户端,一个应用程序主机和一个任务执行器。 客户端接受传入的TensorFlow作业; 应用程序主机与YARN的资源管理器协商以在YARN上配置作业; 任务执行器实际上是在YARN集群上启动的,用于运行TensorFlow作业。

LinkedIn声称使用Tony时TensorFlow作业没有明显的开销,因为Tony“位于[编排分布式TensorFlow的层中,并且不会干扰TensorFlow作业的实际执行。”

Tony还可以使用TensorBoard应用程序来可视化,优化和调试TensorFlow应用程序。

翻译自: https://www.infoworld.com/article/3305590/linkedin-open-sources-a-tool-to-run-tensorflow-on-hadoop.html

linkedin开源列表

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值