隐语架构
隐语定位
1、通过可视化产品,降低终端用户的体验和演示成本
2、通过模块化 API 降低技术集成商的研发成本
人群画像
作为隐语的直观入口,隐私保护计算从业者均应该关注
隐语产品
PSI/PIR
PSI:一种特殊的安全多方计算(MPC)协议
Alice 持有集合 X,Bob 持有集合 Y
Alice 和 Bob 通过执行 PSI 协议,得到交集结果 X 和 Y 的交集
除交集外不会泄露交集外的其他信息
PIR:匿踪查询
用户查询服务端数据库中的数据,但服务端不知道用户查询的是哪些数据
Data Analysis
SCQL:一种多方安全数据分析系统,可以让互不信任的参与方在保护自己数据隐私的前提下,完成多方数据分析任务
核心特性
联邦学习
在原始数据不出域的情况下,通过交换中间数据来完成机器学习建模,包含水平学习和垂直学习
思考
联邦学习的应用场景目前还没有成熟的市场体系
按照个人目前已知,该模式下能运行的数据量级小,占用资源多,效率不高,且仍然会存在数据出本地库的情况,导致很多企业不愿意使用该模式
隐语在做联邦学习的数据量级是最多能支撑到多少
计算层
混合编译调度 - RayFed
基于ray的跨机构分布式调度计算框架,提供单机构内任务调度能力和跨机构外多任务协作能力
- rayfed对多集群如何部署和运作的,与dolphin之间有啥异同点,后续课程希望能够介绍
密态引擎
SPC
HEU
同态加密原理示意图
Alice把3和5加密成数据A和B,发送给Bob,Bob将A和B相加得到C,把C返回给Alice,Alice解密就得到8
同态加密分类
PHE:支持密态加法或乘法
LHE:支持有限次的加法和乘法
FHE:支持无限次的加法和乘法
TEEU
密码原语YACL
为啥重新做了密码库YACL:学术届和工业界的密码标准没有完全统一,维护和稳定性也没有很好的支持,工具不太好用,所以形成了自己的密码库
资源层Kusia
- 数据管理
- 网络管理
- 计算资源管理
- 应用管理
跨域管控
总结
隐语是一个隐私计算框架,高内聚,低耦合的设计思想使每个模块既能独立使用又能组合使用,对于不同算法,数据分析,产品等不同定位的人都提供了方案,这次课程让学员能够快速上手隐语,应用到自身的业务数据场景中