使用KubeFATE部署一个两方的联邦学习集群(问题解决记录)

问题1   执行minikube start --vm-driver=none报错

加上参数,用国内阿里云

minikube start --image-repository=‘registry.cn-hangzhou.aliyuncs.com/google_containers‘ --vm-driver=none

还是不行,改用以下方式终于成功了:

minikube start --registry-mirror=https://registry.docker-cn.com --image-repository=registry.cn-hangzhou.aliyuncs.com/google_containers --vm-driver=none

问题2 执行集群安装卡住

kubefate cluster install -f ./fate-9999.yaml

查看:

kubectl get po -n fate-9999

发现python这个pod卡住了,查看日志发现是下载federatedai/client:1.6.0-release镜像不成功

手动从163下载镜像:

docker pull hub.c.163.com/federatedai/client:1.6.0-release

这个镜像异常大,第二天我才发现下完:

hub.c.163.com/federatedai/client                                              1.6.0-release       7b802ce33a28        7 months ago        4.66GB

然后执行安装,9999和10000两个party均安装成功。

可查看所有po:kubectl get po --all-namespaces

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值