使用TensorFlow和Kubernetes构建GPU加速工作流

最新推荐文章于 2021-10-20 10:52:36 发布

糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖

最新推荐文章于 2021-10-20 10:52:36 发布

阅读量102

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cpongo4/article/details/89120799

版权

\
看新闻很累？看技术新闻更累？试试下载InfoQ手机客户端，每天上下班路上听新闻，有趣还有料！
\

\\

Daniel Whitenack在最近举行的北美2017 KubeCon+CloudNativeCon大会上分享了如何使用TensorFlow和Kubernetes进行基于GPU的深度学习。

\\

他以物体检测为例子介绍了一种典型的人工智能工作流程。该工作流程包括预处理、模型训练、模型生成和模型推理。这些步骤都可以运行在Docker容器里。

\\

模型训练一般是通过框架来完成的，如TensorFlow或Caffe。在这一阶段，GPU可用于帮助提升性能。深度学习在使用TensorFlow或其他框架时，需要借助GPU在图像数据上训练模型。

\\

模型训练可以运行在Kubernetes集群的GPU节点上。Kubernetes为多GPU节点提供了一个非常好的框架，按照如下步骤可实现更好的工作流：

\\

将数据正确地分配代码（pod）。\

在正确的节点上处理数据。\

在正确的时间触发正确的代码。\

该工作流程也可以用于跟踪哪个版本的代码和数据产生了哪些结果（用于调试、维护和合规的目的）。

\\

Kubernetes为此提供了基础支持，也因为它具备了可移植性和可伸缩性，所以非常适用于机器学习项目。

\\

Whitenack介绍了一个叫作Pachyderm的开源项目，它支持数据管道，并为Kubernetes提供了数据管理层。工作流中一般会包含多个数据预处理和后处理作业。Pachyderm提供了统一的框架用于调度多步骤工作流、数据管理和向GPU分配工作负载。

\\

Pachyderm框架的特性包括：

\\

数据版本：版本化的数据可存储在Amazon S3数据库里。\

用于分析的容器。\

分布式管道或数据处理DAG。\

数据监管：可用于合规和调试。\

Whitenack在现场进行了演示，使用Pachyderm和Kubernetes实现了一个AI工作流。示例应用程序实现了图像到图像的转换，将卫星图自动转成地图。他在例子中使用TensorFlow进行模型训练和推理。

\\

如果读者对Pachyderm框架感兴趣，可以参考机器学习示例、开发者文档、Kubernetes GPU文档，或者直接加入Slack通道。

\\

查看英文原文：Building GPU Accelerated Workflows with TensorFlow and Kubernetes

糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用TensorFlow和Kubernetes构建GPU加速工作流

\看新闻很累？看技术新闻更累？试试下载InfoQ手机客户端，每天上下班路上听新闻，有趣还有料！\\\Daniel Whitenack在最近举行的北美2017 KubeCon+CloudNativeCon大会上分享了如何使用TensorFlow和Kubernetes进行基于GPU的深度学习。\\他以物体检测为例子介绍了一种典型的人工智能工作流程。该工作流程包括预处理、模型训练、模型生成和模型推理。这...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。