KubeFlow安装指南

KubeFlow是Google提出的基于Kubernetes的机器学习解决方案,允许用户在TFJob上进行分布式训练。本文将引导你了解KubeFlow的组件、使用场景、依赖库和安装步骤,包括Ksonnet、kubectl的安装,以及如何查看和定义TFJob资源。
摘要由CSDN通过智能技术生成

【摘要】 Kubeflow是Google推出的基于kubernetes环境下的机器学习组件,通过Kubeflow可以实现对TFJob等资源类型定义,可以像部署应用一样完成在TFJob分布式训练模型的过程。

 

8c8213f350aa123d6708e5df5c7de9975e8.jpg 

组件

http://pachyderm.io/ 

http://www.argoproj.io/

Kubeflow使用场景

  • 希望训练tensorflow模型且可以使用模型接口发布应用服务在k8s环境中(eg.local,prem,cloud)

  • 希望使用Jupyter notebooks来调试代码,多用户的notebook server

  • 在训练的Job中,需要对的CPU或者GPU资源进行调度编排

  • 希望Tensorflow和其他组件进行组合来发布服务

依赖库

  • ksonnet 0.11.0以上版本 /可以直接从github上下载,scp ks文件到usr/local/bin

  • kubernetes 1.8以上(直接使用CCE服务节点,需要创建一个CCE集群和若干节点,并为某个节点绑定EIP)

  • kubectl tools

 1、安装ksonnet

 ksonnet 安装过程,可以去网址里面查看ks最新版本

wget https://github.com/ksonnet/ksonnet/releases/download/v0.13.0/ks_0.13.0_linux_amd64.tar.gz
tar -vxf ks_0.13.0_linux_amd64.tar.gz
cd -vxf ks_0.13.0_linux_amd64
sudo cp ks /usr/local/bin

安装完成后

image.png

2、安装kubectl工具

wget https://cce-storage.obs.cn-north-1.myhwclouds.com/kubectl.zip
yum install unzip
unzip kubectl.zip
cp kubectl /usr/local/bin/
#在集群页面查看kubectl工具
#下载并复制下图中的config文件内容
mkdir /root/.kube/
touch /root/.kube/config
vi /root/.kube/config
#黏贴内容 :wq!保存
#因为这边节点已经绑定了EIP,直接选择集群内访问即可
kubectl config use-context internal

image.png

安装成功后执行kubectl version查看版本信息是否符合要求

image.png

3、安装kubef

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
Kubeflow是一个开源机器学习工具包,它可以方便地在Kubernetes集群上管理和部署机器学习工作负载。以下是在Kubernetes集群上安装和部署Kubeflow的基本步骤: 1. 安装Kubernetes集群 首先需要在你的环境中安装一个Kubernetes集群,可以使用各种工具来安装,如kubeadm、kops、k3s等。 2. 安装Kubeflow CLI Kubeflow CLI是一个命令行工具,它可以方便地在Kubernetes集群上安装和管理Kubeflow。可以通过以下命令来安装Kubeflow CLI: ``` $ export KUBEFLOW_VERSION=1.4.0 $ export PLATFORM=linux-anvil $ curl https://raw.githubusercontent.com/kubeflow/kfctl/v${KUBEFLOW_VERSION}/scripts/download.sh | bash $ sudo install -m 755 kfctl_${KUBEFLOW_VERSION}_${PLATFORM} /usr/local/bin/kfctl ``` 3. 配置Kubeflow安装Kubeflow之前,需要先创建一个配置文件,用于指定Kubeflow的一些参数和选项。可以使用以下命令来创建一个默认的配置文件: ``` $ export KF_NAME=my-kubeflow $ export BASE_DIR=/opt $ export KF_DIR=${BASE_DIR}/${KF_NAME} $ export CONFIG_URI=https://raw.githubusercontent.com/kubeflow/manifests/v1.4-branch/kfdef/kfctl_k8s_istio.v1.4.0.yaml $ mkdir -p ${KF_DIR} $ cd ${KF_DIR} $ kfctl init ${KF_NAME} --config=${CONFIG_URI} -V ``` 在上面的命令中,`KF_NAME`指定了Kubeflow的名称,`BASE_DIR`指定了Kubeflow安装目录,`CONFIG_URI`指定了Kubeflow的配置文件地址。 4. 安装Kubeflow 完成配置后,可以使用以下命令来安装Kubeflow: ``` $ kfctl apply -V -f ${KF_NAME}/kfctl_k8s_istio.v1.4.0.yaml ``` 这个命令会在Kubernetes集群上启动所有需要的服务和组件,包括Kubeflow的核心组件,如Jupyter Notebook、TensorFlow Serving、Katib等。 5. 访问Kubeflow安装完成后,可以通过以下命令来获取Kubeflow的URL: ``` $ kubectl -n istio-system get ingress gateway -o jsonpath='{.spec.rules[0].host}' ``` 将输出的URL复制到浏览器中,就可以访问Kubeflow的Web界面了。 以上是在Kubernetes集群上安装和部署Kubeflow的基本步骤。需要注意的是,Kubeflow安装和配置可能会因为不同的环境和需求而有所不同,需要根据实际情况进行调整和优化。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青年夏日科技

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值