为进一步促进数据高效流通和数据要素市场高质量发展,推动隐私计算产业健康快速发展。2023隐私计算大会暨首届“星河杯”隐私计算大赛颁奖典礼活动于7月26日在青岛成功举办,吸引了过万人次关注。
DataFountain大数据竞赛平台(简称DF平台)作为大赛官方竞赛平台,为活动提供支持。
为解决数据供给不充足、机构相互不信任、安全流通无范式、数据使用不可控等问题,中国信通院、隐私计算联盟联合行业多家企业共同提出可信数网TDN,它是数据流通中各个参与方在互认、互信、互联的机制下,通过“织点成域、联域成网”,形成的跨区域、跨行业、跨主体的数据流通基础设施。
为夯实可信数网的技术互联基础,解决不同企业间数据流通技术互操作性不足、架构不统一等问题,中国信通院联合中移信息、联通数科、天翼电商、工商银行、招商银行、微众银行、蚂蚁集团、百度、洞见科技、金智塔科技、亚信科技、富数科技、蓝象科技、数牍科技、华控清交、广州金控、深圳云计算、同盾科技、融数联智、星环科技、合肥数据空间研究院等一起发布了“互联互通推进计划:隐私计算互联互通第二批试点项目”,包括三个算法(ECDH-PSI、SS-LR、PHE-FLR)的开放协议及实践和三个管理调度层的互联实践。
同时会上中国信通院也解读了《隐私计算 跨平台互联互通 第4部分:应用要求》标准。
隐私计算互联互通第二批试点项目
两年多来,隐私计算联盟、中国信通院云大所携手行业各方对隐私计算互联互通开展持续探索。第1步,制定标准,凝聚共识。2021年初中国信通院牵头制定《隐私计算 跨平台互联互通 第1部分:总体框架》标准,并持续构建标准体系。业内由此出现了一些企业散点合作。第2步,联合散点,探索实践。2022年7月启动 “互联互通实践示范”第一批征集项目,通过遴选优秀方案,孵化试点项目。第3步,搭建平台,织点成网。联盟协同多家金融机构、运营商和技术企业成立“”互联互通推进计划”,聚力更多应用方、技术方,推广适合业务场景的互联方案,搭建真正的行业级乃至跨行业的互联互通生态,助力建设数据流通大网络。
在节点对齐、数据资源对齐的基础上,算法的互联方案总体归纳为两个层次,“算法调度互联”(黑盒)和“开放算法互联”(白盒)。在开放算法互联方面,隐私计算联盟陆续发布了ECDH-PSI(基于椭圆曲线迪菲-赫尔曼密钥交换的安全求交)和SS-LR(基于秘密分享的逻辑回归)的开放协议规范,并联合三大通信运营商和数家技术企业开展实践验证。
为进一步促进互联互通接口规范的统一,隐私计算联盟今年上半年启动了“互联互通实践示范”第二批征集项目,扩大了征集范围,涵盖面向所有数据流通技术的跨平台互联互通,包括使用控制、区块链、数据沙箱等。
互联互通推进计划工作组征集了六个互联互通试点方案。在技术方案层面,包括开放算法互联和调度互联两大类,同时也首次出现了融合区块链技术的方案。在实践企业方面,涉及三大通信运营商、三家银行和数十家技术企业,参与企业数量较去年显著增加。
在开放算法互联方面,目前已完成三个算法的协议规范,并进行了跨行业多机构的互联实践。《第1部分:ECDH-PSI》 在去年三方互联的基础上,今年又引入了更多参与方,成为首个实现8家企业、跨“三大通信运营商+银行+互联网”互联的算法协议。其协议的2.0版本也将协议握手和算法主体运行阶段的内容进一步优化,提高了算法的灵活性、扩展性和性能。《第2部分:SS-LR》,将算法协议解耦细分为四个层次,有利于后续算法的优化提升,同时也开展了跨“三大通信运营商+互联网”的实践。《开放协议 第3部分:PHE-FLR(基于半同态的联邦多元线性回归)》,在联通TFP方案的基础上提取了开放算法协议的共性内容形成规范,并进行了跨“通信运营商+互联网”的互联验证。
在算法调度互联方面,包括三个试点方案:中移动牵头提出运营商分级互联互通及纳管模式,实现了数十家企业的互联;金智塔通过利用可插拔的互联互通服务提供对外的统一接口和适配,实现了与招行在多个算法上的注册、发现、计算互联;蚂蚁摩斯基于引入的开放层来对接不同系统的引擎,利用工具有效降低适配成本。可以观察到,虽有不同的互联实践,但是各方案的调度互联接口基本类似,与去年相比更加细化,而且适配工具化思路逐渐显现。
基于各企业开展的互联实践工作,推进计划工作组邀请亚信科技、华控清交、金智塔科技、数牍科技成为第二批成员单位。后续,推进计划工作组也将持续开展数据流通技术的跨平台互联互通工作,为可信数网TDN建立互联基础,通过可信数网测试床,提供入网的相关检测服务。
《隐私计算 跨平台互联互通 第4部分:应用要求》标准
从2021年初开始,中国信通院牵头编制《隐私计算 跨平台互联互通》系列标准来帮助行业强化互联互通的概念、梳理实现思路。具体包括总体框架、通信要求、互联协议和应用要求四个部分的标准,截止去年底已经完成了前三部分的标准。
今年上半年,CCSA TC601、隐私计算联盟联合数十家企业,通过深入研讨《第4部分:应用要求》标准的编制思路、标准框架和技术细节要求,最终形成共识,实现文本内容基本定稿。
《应用要求》是在《通信要求》和《互联协议》的基础上,规范了跨平台隐私计算任务执行过程中的计算协同要求和结合具体场景算法的应用步骤要求。主要包括术语和定义、概述、基础要求、组件与流程管理、组件与任务的管理、执行、监控、存证和应用步骤要求等内容。
首先是基础要求,提出了节点认证、资源授权与访问、密码算法安全和通信协议等应满足的《通信要求》和《互联协议》中的计算前置要求。
其次是概述部分,主要阐述了本标准的总体结构和涵盖内容,并对隐私计算算法在计算过程中涉及的相关实体(组件、流程、任务、作业、项目等)和参数、以及实体间关系进行了声明。同时在附录中给出了相关实体和参数的规范性字段。
然后是计算协同要求,对不同技术平台间进行跨平台计算的任务与作业的管理、编排、调度、执行、监控和存证等方面进行规范约束。包括组件的注册与列表管理、流程的创建与审批、作业与任务的创建、审批、调度、状态同步、启动、停止、监控和存证等一系列的内容。
最后是应用步骤要求,对隐私计算算法运行过程中的7项步骤进行明确,包括信息查询、节点联通、数据准备、算法选择、作业与任务配置、作业与任务运行和结果处理等内容。同时在附录中也给出了安全求交、安全查询、安全统计、安全建模和安全预测这五大类型算法中几个典型常用算法的参数示例,为标准落地提供参考。
非常感谢各单位相关专家的积极供稿和讨论,感谢大家的大力支持和帮助!未来我们将继续开展互联互通的相关工作,助力可信数网和数据要素市场的建设!
开放协议文档下载地址:
https://github.com/caict-ppca/privacy-computing
开源参考实现地址:
https://github.com/caict-ppca/interconnection