基于Kubernetes的机器学习系统

基于Kubernetes的机器学习系统

基于Kubernetes搭建机器学习系统,将可以利用大型集群管理和微服务架构实现大规模、生产级的训练、研究和应用机器学习系统,Nvidia的 HGX超级机器学习平台 也基于该架构,具有强大的运算和IO能力。

Enables the Worldâs Largest GPU

1、基于Kubernetes的机器学习流程

机器学习系统包括训练框架、机器学习计算引擎、样本数据库、计算模型库、超级参数库、应用框架和移动应用(包括引擎、框架和参数库调优等)等部分。为了生产级的应用,还需要具有有配置参数及其版本化的管理,样本数据库、超级参数和环境配置参数往往存储在虚拟存储系统上(如NFS/Rook),以实现多个节点的并行处理访问所需。

2、基于Kubernetes的机器学习资源

本文将包含基于Kubernetes的机器学习系统相关参考资源,包括基于Ubuntu的Nvidia图形驱动驱动、cuDNN深度学习引擎、Nvidia Docker2、Nvidia Plugin for Kubernetes、Kubeflow、Spark ML等安装和配置方法。

3、Kubenrnetes集群安装参考

4、Kubenrnetes网络部署参考

5、机器学习前端应用方向

在机器学习平台中,后端主要用于训练和大型分析、在线服务,而前端通过低功耗的专用芯片实现模型的应用,如自动驾驶、图像分类、视频理解、人脸识别、语音合成、视觉定位等等,有基于ASIC、FPGA、DSP、ARM的专用芯片和多种方案,体积和功耗都是比较低的,可以在包括手机上的移动设备上运行。

转载于:https://my.oschina.net/u/2306127/blog/1822919

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值