联邦学习框架FATE实践（训练/测试步骤及参数说明）

最新推荐文章于 2025-03-05 08:46:07 发布

wendong97

最新推荐文章于 2025-03-05 08:46:07 发布

阅读量1.5w

点赞数 14

分类专栏： FATE联邦学习文章标签：深度学习 python

本文链接：https://blog.csdn.net/WenDong1997/article/details/106743620

版权

本文详细介绍了FATE联邦学习框架的训练和测试步骤，包括FATE的基本概念，如Guest、Host和Arbiter的角色。在训练部分，讲解了数据上传配置、DSL配置、运行配置的定义，并描述了训练过程。测试部分则涵盖了预测配置的设定、预测过程、查看和下载预测结果。FATE的使用有助于保护数据隐私，实现多方安全协作建模。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

联邦学习框架FATE实践（训练/测试步骤及参数说明）

一、FATE概念

1. 角色

在Fate的概念中分成3种角色，Guest、Host、Arbiter
（1）Guest表示数据应用方，在纵向算法中，Guest往往是有标签y的一方。一般是由Guest发起建模流程。
（2）Host是数据提供方
（3）arbiter是用来辅助多方完成联合建模的，主要的作用是用来聚合梯度或者模型,比如纵向lr里面,各方将自己一半的梯度发送给arbiter，然后arbiter再联合优化等等,arbiter还参与以及分发公私钥，进行加解密服务等等。

二、训练

1. 准备

在FATE中构建算法模型，需要准备三个配置文件。
（1）上传数据配置文件：用于上传数据
（2）DSL配置文件：用于定义建模任务
（3）运行配置文件：用于设置每个组件的参数

2. 定义上传数据配置文件

（1）参数说明：

file: 文件路径
head: 指定数据文件是否包含表头
partition: 指定用于存储数据的分区数
work_mode: 指定工作模式，0代表单机版，1代表集群版
table_name&namespace: 存储数据表的标识符号

（2）示例

{
   
  "file": "examples/data/breast_b.csv",
  "head": 1,
  "partition": 10,
  "work_mode": 0,
  "table_name": "hetero_breast_b",
  "namespace": "hetero_guest_breast"
}

3. 定义DSL 配置文件

（1）概念

FATE 使用特定语言 DSL 来描述任务，各种模块可通过一个有向无环图组织起来。DSL 配置文件采用 json 格式，整个配置文件就是一个 json 对象（dict）。在这个 dict 的第一级是 “components”，表示这个任务将会使用到的各个模块，每个独立的模块定义在 “components” 之下。

（2）参数说明

module_name：模块的键。用户需要使用模块名加数字 _num 作为对应模块的 key，例如 dataio_0，并且数字应从 0 开始计数。这用于区分可能存在的多个相同种类的模块。
module：用来指定使用的模块。这个参数的内容需要和 federatedml/conf/setting_conf 下各个模块的文件名保持一致。模块名链接
input：输入。分为两种输入类型，分别是 data 和 model。
output：输出。和 input 一样，有 data 和 model 两种类型。
need_deploy：是或否。该字段用于指定组件是否需要部署以进行在线推断。该字段仅用于在线推论dsl推论。

（3）示例

{
   
  "components" : {
   
          "dataio_0": {
   
                "module": "DataIO",
                "input": {
   
                    "data": {
   
                        "data": [
                            "args.train_data"
                        ]
                    }
                },
                "output": {

最低0.47元/天解锁文章