最近突然在部署FATE,有了一些操作流程的小结
从开始部署我放弃了好多次,遇到了很多问题:
- 要在linux下进行部署,linux下遇到过:root权限,虚拟机安装linux, 内存分得太小了,安装python, pip,要不要用conda等
- 安装fate的时候,docker下载慢,容器的建立,文件夹的切换,寻找文件夹等。
- 例子跑不通,配置不会配。
前两天慢慢摸索到流程,一下是总结的:
- 首先是两个选择:conda环境和直接安装,都可以
- 接着就时按着教程建立文件夹(自己建的话要记住名字),ls 就是查看文件夹下的文件
- 先在docker下载微众的资源,创建容器
- 单机部署,会遇到缺包的情况, 好像有pip request
- 可以跑给的两个toy_example,到了具体的例子,需要自己上传数据和配置,因为默认配置有时是默认集群的,修改work_mode= 0,这是单机版,work_mode=1是集群版。
- 当上传失败时分为几种情况,连接失败,估计是端口问题,提交错误,可能就是设置问题。
- 那个doc特别有用,我还没分清V1,V2的区别;还有examples有两个地方有,有什么区别等。
- 找不到文件,可能是路径没打正确。
https://github.com/FederatedAI/FATE/tree/master/examples/dsl/v1
补充:
flow下的example通常只是用来测试flow的基础功能是否正常用的
FATE/examples 是测试算法模块用的
最后感谢所有的群里联邦小伙伴的答疑,共同前进。
扫雷:
FATE
Kubefate: