纵向树模型
纵向分割的数据集(多方拥有不同维度)+树模型算法(有效性和可解释性)
对比
SS-XGB(可证安全),基于秘密分享
需要SPU设备,考虑MPC协议
参数比较少
产出一个密态模型,各方只持有分片,预测结果是密文
SGB ,基于联邦学习和同态加密
需要HEU设备,考虑同态加密协议
参数更多,包含训练参数和安全和联邦的参数
产出一个联邦模型,各方都有明文模型,预测结果是明文
原理
逻辑上
1. 确定要保护的数据部分
2. 准备安全原语(计算和通信)
3. 改造数据结构和算法(单机训练变成多方隐私计算)
如何修改
很棒的开发经验
组件封装三部曲:
1. 定义组件主体,确定版本信息和功能
2. 定义参数和io
3. 定义调用方法
算法修改三部曲:
1. 阅读代码,理清主要流程
2. 修改对应模块
3. 及时测试,验证效果
优势
其实感觉最明显的就是PYU SPU HEU的设备抽象,屏蔽了底层的多方安全计算的通信细节,提高了抽象程度,一方面SPU等设备对算子的优化提高了整体的效率,另一方面优化了使用体验