1 隐语架构一览
分层原因有几个出发点,第一个出发点是考虑到完备性的问题,目前来看,整个隐私计算,没有绝对优势的一个技术路线,故支持很多技术,比如同态、安全多方计算、差分隐私等;第二个出发点是每个分层的下一层对于上一层是透明的,即分层内部是高内聚的状态,层与层之间是一个低耦合的状态 ,希望开源用户可以从内层入手开始进行集成;第三个出发点是隐语有更好的开放性,通过良好的分层设计,希望不同专业人员可以在所属层里充分发挥专业优势。
2 隐语架构拆解
隐语产品
产品定位是通过可视化产品,降低终端用户的体验和演示成本。同时,通过模块化API降低技术集成商的研发成本。
人群画像(作为隐语的直观入口,隐私保护计算从业者均应关注):隐私保护计算集成商、隐私保护计算需求方、产品人员、开发人员、研究人员……
SecretPad(隐语的配平化产品)提供了轻量化安装的体验,可以快速验证POC,可定制集成。
多部署形态:中心模式,P2P模式(计划)。
全栈产品:MPC、TEE、SCQL。
SecretNote:Notebook形式,交互式建模、多节点一站式管理和交互、运行状态跟踪。
算法层:PSI与PIR
产品定位:高性能、轻量化、易 用的PSI/PIR专用协议模块。
人群画像:PSI/PIR产品人员、PSI/PIR需求人员、PSI/PIR研发人员。
PSI(Private Set Intesection): 一种特殊的安全多方计算(MPC)协议 ;Alice持有集合 X,Bob持有集合Y; Alice和Bob通过执行PSI协议,得到交集结果X ∩ Y ;除交集外不会泄漏交集外的其它信息。
PIR(Private Information Retrieval) 用户查询服务端数据库中的数据, 但服务端不知道用户查询的是哪些数据。
算法层:Data Analysis
Data Analysis-SCQL(Secure Collaborative Query Language):一种多方安全数据分析系统,可以让互不信任的参与方在保护自己数据隐私的前提下,完成多方数据分析任务。
产品定位:屏蔽底层安全计算协 议的复杂性,以简单 熟悉的 SQL 语言界 面,提供多方数据密 态分析能力。
人群画像:数据分析集成商、数据分析产品人员、数据分析需求人员、数据分析研发人员。
核心特性:【1】半诚实安全模型;【2】支持多方(N>=2);【3】易上手,提供MySQL兼容的SQL方言用户界面;【4】支持常用的SQL语法和算子,满足大部分场景的需求;【5】可实用的性能;【6】提供列级别的数据使用授权控制(CCL);【7】支持多种密态协议(SEMI2K/CHEETAH/ABY3);【8】内置支持多种数据源接入(MySQL,Postgres,CSV等)。
算法层:联邦学习
在原始数据不出域的前提下,通过交换中间数据完成机器学习建模。
包含水平联邦和垂直联邦(主要是拆分学习,Split Learning)。
产品定位:具备安全攻防保障明密文混合机器学习框架和算法。
人群画像:深度学习需求方、深度学习产品人员、安全AI研究人员。
计算层:混合调度编译
混合调度编译-RayFed:在Ray的基础之上所构建的专注于跨机构的分布式计算调度框架。
产品定位:面向跨机构场景,提 供单机构内计算任务 独立调度和跨机构计 算任务协作的能力。
人群画像:隐语工程开发人员、隐语算法开发人员。
计算层:SPU
SPU(Secure Process Unit)
产品定位:桥接上层算法和底层 安全协议,保持原生 AI框架体验的同时为 用户提供透明的、高 性能的、基于安全协 议的密态计算能力。
人群画像:机器学习研发人员、密码协议研发人员、编译器研发人员。
核心特性:【1】原生对接主流AI前端;【2】 支持丰富的机器学习算法 ;【3】带隐私保护语义的中间表示语言;【4】 基于MLIR的加密计算编译优化;【5】高性能MPC协议虚拟机 ;【6】多种数据并行,指令并行优化;【7】 丰富的MPC协议,适配各种场景;【8】支持协议扩展,支持异构设备接入。
计算层:HEU
HEU(Homomorphic Encryption Unit)
产品定位:低门槛,高性能的同 态加密库,支持多类 型、可扩展的算法协 议和硬件加速生态。
人群画像:同态加密用户、同态算法研究人员、同态硬件研发人员。
核心特性:支持多种PHE算法,性能业界领先,支持多种接口(Numpy-like API、C++、Python),硬件加速。
计算层:TEEU
TEEU(Trusted Enextution Environment Unit)
产品定位:支持多种可信执行环 境的、具备数据使用跨域管控能力的密态计算枢纽,可执行数 据分析、机器学习、 MPC/FL加速等功能。
人群画像:数据合规研究人员、TEE软件开发人员、TEE硬件制造厂商。
计算层:YACL
YACL(Yet Another Common Crypto Library)
产品定位:多种隐私计算技术路线共同需要的密码库,具备安全实现保证、高性能等特点。
人群画像:安全/密码研究人员。
资源层:kuscia
kuscia(KUbernetes based Secure Collaborative InfrA)
产品定位:屏蔽不同机构间基础设施的差异,为跨机构协作提供丰富且可靠的资源管理和任务调度能力。
人群画像:隐私保护计算集成商、运维开发人员。
互联互通
产品定位:隐语和其它厂商的平台可以互联互通,共同完成一个隐私计算任务。
人群画像:互联互通需求方、算法研发人员、平台研发人员、隐私保护计算集成商。
跨域管控
产品定位:数据离开持有者的运维域后,数据方仍然能够有效地控制数据 的流转过程,避免其被窃取或者非预期使用。
人群画像:隐私保护计算需求方、监管方、运维人员。
三权分置:数据要素“三权”在数据流转过程中诞生与流转, 数据要素“三权”权益的机制保障核心是数据加工使用权跨域管控。