隐私计算实训营第二期-第十一课
第十一课:组件介绍与自定义开发
首先必须感谢蚂蚁集团及隐语社区带来的隐私计算实训第二期的学习机会!
本节课由蚂蚁隐私计算专家冯骏老师讲解。
本节课内容主要有4点:
- 隐语开放标准
- 隐语组件列表
- 调用隐语组件
- 新增隐语组件
1 隐语开放标准
首先隐语是有一个层级架构组成,下层是各种计算引擎,中层是调度
架构Kuscia,上层是UI应用。
1.1 隐语数据标准
数据的proto定义为DistData,可以理解为对数据的公开的描述,
记录这个数据的名称,类型,拥有方等信息,这个描述是公开的。
对于远程数据,就可以根据这个DataRef和存储配置获取到这个远程数据。
这里的获取是指能用于计算,并不一定是指能获取到源数据。
1.2 隐语组件标准
隐语的组件标准定义了组件的命令、属性、组件的输入和输出要求。
组件有多种类型,比如原子的、联合的、结构体的。组件可以:
- 指定输入输出的类型,可以是多种类型。
- 如果是表,可以进一步指定使用的列。
- 还可以进一步指定每一选中列需要填入的参数。
1.3 隐语节点执行标准
隐语也有节点执行标准,需要定义相应的节点评估参数、存储配置,所用
的组件列表,然后最终得到评估结果。
1.4 隐语节点执行标准
隐语运行报告也有相应的标准,运行报告也是一种DistData,通常作为
部分组件的输出,用户界面可以根据定义来渲染运行报告。
2 隐语支持的组件
隐语支持丰富的组件,包括特征、预处理、统计、模型训练、模型预测等。
3 隐语组件的调用
3.1 隐语组件的三种调用方式
本节课的重点在于介绍了组件的调用,主要有三种调用方式。
- 通过库中的API调用
- 通过Kuscia调度架构调用
- 通过前端选取组件进行调用
3.2 隐语组件的自定义
课程最后还讲述了隐语组件的自定义调用,主要方式进行先实现自定义组件,然后注册自定义组件,最后生成Docker镜像。
本节课需要结合隐语进行实操,熟悉隐语的调用和自定义的组件开发方式。