fate算法模块信息
也可在fate git文件查看
主要文档介绍官方给的一部分算法流程内部情况
- 1、Dataio
- 2、Intersection
- 3、Hetero_Lr
- 4、evaluation_0
- 5、Hetero_Secureboost
1.Dataio
1.1.运行前数据
图 1 upload之后的数据图
1.2.运行之后的数据
图 2 dataio运行之后数据格式
图 3 具体内容
1.3.分析
数据upload之后数据如图1,,全是明文状态,由于之前配置文件设置的分区是两个分区,所以看出有两个文件夹。分别为0,1.
经过dataio之后数据的结果如图2,经了解以及代码查看,instance包括weight权重,features特征值,label标签。
2.Intersection
2.1.数据上传前host数据
图 4 数据经过intersection之前图
2.2.数据上传前guest数据
图 5 数据经过intersection之前图
2.3.数据经过intsection后guest数据
图 6 数据经历intsection之后guest数据
2.4.数据经过intsection后host数据
图 7 数据经历intsection之后host数据
图 8 Instance属性值
2.5.公私钥
1.生成方:host
2.发送方:guest
3.操作字段 :数据id,封装成sid字段
4.rsakey:
a)“e”: 65537,
b)“d”: 655184017050822848806336059182629522061469354055062114882801034140858854135131334260379640442441422136340553466085207599031280746344619290192191912492399773587356856541042150857485520985736282701768229468330258669270948393326641481085359977737549881342290524971139256856446852646159029429340528611004630273,
c)“n”: 30848383197804052889176814163674207717164697053778495278249324814708580478977008539946673355610089484346133692510046532702160932118340884051601920997833113359556476966325487973995849659964706400975905241258859050578432546951333248110905569276122022408651879004683266312259409896753270125373426386913968800323
5.publickey:
a)‘e’: 65537,
b)‘n’: 30848383197804052889176814163674207717164697053778495278249324814708580478977008539946673355610089484346133692510046532702160932118340884051601920997833113359556476966325487973995849659964706400975905241258859050578432546951333248110905569276122022408651879004683266312259409896753270125373426386913968800323
Ps:rsa密钥包括,e,d,n,三块,e,n,作为公钥发放给guest,d,作为私钥保留
2.6.任务解析
Intersection主要进行的是数据的交互,也可以称为数据对齐,比对,guest和host两端的id字段或者是数据标识字段,在fate中默认是数据的第一列,然后这个会被在Dtable中保存成sid字段,进行Intersection过程,会进行加密,加密过程分为: