官方文档:上传数据指南 — FATE documentation
启动虚拟环境,并进入chapter05下面,如图:
然后执行:
python …/fate_flow/python/fate_flow_client.py -f upload -c upload_train.json
-f :函数名称
-c :配置文件
将验证集也上传上去:
fate02和fate03重复上面的步骤,把训练集和测试传上去。
到这里数据集已经上传,接着就可以开始做训练了。
=================================================================
为了让任务模型的构建更加灵活,目前 FATE 使用了一套自定的领域特定语言 (DSL) 来描述任务。在 DSL 中,各种模块(例如数据读写 data_io,特征工程 feature-engineering, 回归 regression,分类 classification)可以通向一个有向无环图 (DAG) 组织起来。通过各种方式,用户可以根据自身的需要,灵活地组合各种算法模块。
除此之外,每个模块都有不同的参数需要配置,不同的 party 对于同一个模块的参数也可能有所区别。为了简化这种情况,对于每一个模块,FATE 会将所有 party 的不同参数保存到同一个运行配置文件(Submit Runtime Conf)中,并且所有的 party 都将共用这个配置文件。这个指南将会告诉你如何创建一个 DSL 配置文件。
官方的文档:DSL 配置和运行配置 V1 — FATE documentation
所以我们需要写一个DSL配置文件和Config文件。
1)DSL文件配置
文件名字:test_homolr_train_job_dsl.json
{
“components” : {
“dataio_0”: {
“module”: “DataIO”,
“input”: {
“data”: {
“data”: [
“args.train_data”
]
}
},
“output”: {
“data”: [“train”],
“model”: [“dataio”]
}
},
“dataio_1”: {
“module”: “DataIO”,
“input”: {
“data”: {
“data”: [
“args.eval_data”
]
},
“model”: [“dataio_0.dataio”]
},
“output”: {
“data”: [“eval_data”]
}
},
“feature_scale_0”: {
“module”: “FeatureScale”,
“input”: {
“data”: {
“data”: [
“dataio_0.train”
]
}
},
“output”: {
“data”: [“train”],
“model”: [“feature_scale”]
}
},
“feature_scale_1”: {
“module”: “FeatureScale”,
“input”: {
“data”: {
“data”: [
“dataio_1.eval_data”
]
}
},
“output”: {
“data”: [“eval_data”],
“model”: [“feature_scale”]
}
},
“homo_lr_0”: {
“module”: “HomoLR”,
“input”: {
“data”: {
“train_data”: [
“feature_scale_0.train”
]
}
},
“output”: {
“data”: [
“train”
],
“model”: [“homolr”]
}
},
“homo_lr_1”: {
“module”: “HomoLR”,
“input”: {
“data”: {
“eval_data”: [
“feature_scale_1.eval_data”
]
},
“model”: [
“homo_lr_0.homolr”
]
},
“output”: {
“data”: [
“eval_data”
],
“model”: [“homolr”]
}
},
“evaluation_0”: {
“module”: “Evaluation”,
“input”: {
“data”: {
“data”: [
“homo_lr_0.train”
]
}
}
},
“evaluation_1”: {
“module”: “Evaluation”,
“input”: {
“data”: {
“data”: [
“homo_lr_1.eval_data”
]
}
}
}
}
}
我在DSL里面配置了训练集组件和验证集组件,这个组件的配置在单机版的横向联邦中提到过。
2)Config配置文件
文件名字:test_homolr_train_job_conf.json
{
“initiator”: {
“role”: “guest”,
“party_id”: 9999
},
“job_parameters”: {
“work_mode”: 1
},
“role”: {
“guest”: [
9999
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
文末有福利领取哦~
👉一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
👉二、Python必备开发工具
👉三、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉 四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(文末领读者福利)
👉五、Python练习题
检查学习结果。
👉六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
👉因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
👉因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
[外链图片转存中…(img-nAHCsLSj-1712501322656)]