kubeflow
文章平均质量分 95
e, kubeflow
张忠琳
我就是我 不用在怀疑
展开
-
【kubeflow文档】Kubeflow Training Operator
Training Operator是一个Kubernetes原生项目,用于对使用各种ML框架(如PyTorch、TensorFlow、XGBoost等)创建的机器学习(ML)模型进行微调和可扩展的分布式训练。用户可以将HuggingFace、DeepSpeed或Megatron LM等其他ML库与Training Operator集成,以协调他们在Kubernetes上的ML培训。原创 2024-06-05 19:40:55 · 342 阅读 · 0 评论 -
【kubeflow文档】kubeflow介绍与架构
Kubeflow项目致力于使机器学习(ML)工作流在Kubernetes上的部署变得简单、可移植和可扩展。目标不是重新创建其他服务,而是提供一种直接的方法,将ML的开源系统部署到不同的基础设施中。无论在哪里运行Kubernetes,都能够运行Kubeflow。原创 2024-05-13 17:17:51 · 322 阅读 · 0 评论