java转kubeflow,安装kubeflow tfjob并让 搭配 volcano 的教程

(1)准备工作,安装好 k8s集群,安装好kfctl

(2)确认你是否有一个默认StorageClass且也配置好了动态pv,确认方法如下:

kubectl get sc

输出:

NAME PROVISIONER AGE

nfs (default) fuseim.pri/ifs 147m

slow kubernetes.io/gce-pd 5d

default表示这个storageclass是默认的。

修改一个storageclass为默认:

kubectl patch storageclass -p '{"metadata": {"annotations":{"storageclass.kubernetes.io/is-default-class":"true"}}}'

(4)安装 istio 和 kubeflow的一些组件

kfctl init

math?formula=%7BKF_DIR%7D%20--config%3D{CONFIG_URI} -V

cd ${KFAPP}

kfctl generate all -V

这一步后会生成 app.yaml 和 kustomize文件夹

注意要 提前创建namespace kubeflow-anonymous

kubectl create namespace kubeflow-anonymous

然后就可以

kfctl apply all -V

但是我直接使用apply的时候seldon-core-operator这个组件装不上,所有我修改了app.yaml并且从kustomize文件夹删除了seldon-core-operator。然后执行apply命令。

(5)安装valcano

见官网

(6)修改valcano的 clustterrole

添加

apiGroups:

'*'

resources:

'*'

verbs:

'*'

(7)修改tf-operator的cluster role

$ kubectl -n kubeflow edit clusterrole tf-job-operator

...

...

apiGroups:

scheduling.incubator.k8s.io

resources:

podgroups

verbs:

'*'

(8)修改tf-operator,让其能使用gang-scheduling

Take tf-operator for example, enable gang-scheduling in tf-operator by setting true to --enable-gang-scheduling flag.

$ kubectl -n kubeflow edit deployment tf-job-operator

...

spec:

containers:

- command:

- /opt/kubeflow/tf-operator.v1beta2

- --alsologtostderr

- -v=1

- --enable-gang-scheduling=true

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值