kubefate部署FATE——三方ssh端口不一致部署
准备工作
三个主机(物理机或者虚拟机,都是ubuntu系统);
所有主机安装Docker 版本 : 18+;
所有主机安装Docker-Compose 版本: 1.24+;
部署机可以联网,所以主机相互之间可以网络互通;
三台服务器之间配置好免密登陆。
官方:使用Docker Compose 部署 FATE.
下载部署脚本
在部署机上下载KubeFATE,相应版本可参考KubeFATE版本下载。本次实验,安装的是KubeFATE1.5.0版本。
wget https://github.com/FederatedAI/KubeFATE/releases/download/v1.5.0/kubefate-docker-compose-v1.5.0.tar.gz
tar -xzf kubefate-docker-compose-v1.5.0.tar.gz
修改配置文件
进入docker-deploy目录
cd docker-deploy
1、修改.env文件
#vi .env
RegistryURI=hub.c.163.com
2、修改parties.conf如下
user=root
dir=/data/projects/fate
party_list=(10000 9999 8888)
party_ip_list=(192.168.1.1 192.168.1.2 192.168.1.3) #服务器ip
serving_ip_list=(192.168.1.1 192.168.1.2 192.168.1.3)
sshport_list=(22222 33333 44444) #服务器对应ssh端口
computing_backend=eggroll
exchangeip=
3、编辑docker_deploy.sh
在第137行DeployPartyInternal函数for循环的此行:
的下一行添加:
同样,在DeployPartyServing、DeleteCluster相同位置,共4处,添加此行。
最后给此文件所有scp和ssh命令添加端口号,共9处,即修改为:
ssh -p $target_party_sshport
scp -P $target_party_sshport
在部署机上执行启动集群脚本
bash docker_deploy.sh all
验证集群基本功能
docker exec -it confs-10000_python_1 bash #进入python组件容器内部
cd /data/projects/fate/examples/toy_example
python run_toy_example.py 10000 9999 1
如果通过测试,屏幕将显示类似如下消息: