隐私计算领域简要介绍及常用软件在国产化平台的支持情况

技术瘾君子1573

于 2024-07-05 07:48:03 发布

阅读量901

点赞数 10

分类专栏： Linux并行计算&HPC高性能计算文章标签：隐私计算 HPC 并行计算国产化 DCU

本文链接：https://blog.csdn.net/qq_27815483/article/details/140087381

版权

Linux并行计算&HPC高性能计算专栏收录该内容

70 篇文章 8 订阅

订阅专栏

一、简介

隐私计算 (Privacy-preserving computation)是指在保证数据提供方不泄露原始数据的前提下，对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。

从 20 世纪 70 年代一直到近年，隐私计算交叉融合了密码学、人工智能、计算机硬件等众多学科，逐渐形成以多方安全计算、联邦学习、可信执行环境为代表，混淆电路、秘密分享、不经意传输等作为底层密码学技术，同态加密、零知识证明、差分隐私等作为辅助技术的相对成熟的技术体系，为数据安全合规流通提供了技术保障。

从技术角度出发，隐私计算是涵盖众多学科的交叉融合技术，目前主流的隐私计算技术主要分为三大方向: 第一类是以多方安全计算为代表的基于密码学的隐私计算技术: 第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术; 第三类是以TEE可信执行环境为代表的基于可信硬件的隐私计算技术。

隐私计算技术为数据的隐私保护与计算提供丰富的解决方案，可从底层硬件、基础层和算法应用等不同角度加以区分。从底层硬件来说，多方安全计算与联邦学习通常从软件层面设计安全框架，以通用硬件作为底层基础架构; 可信执行环境则是以可信硬件为底层技术实现的隐私计算方案。从算法构造来说，多方安全计算技术基于各类基础密码学工具设计不同的安全协议;联邦学习除可将多方安全计算协议作为其隐私保护的技术支撑外，基于噪声扰动的差分隐私技术也广泛应用于联邦学习框架中:可信执行环境通常与一些密码学算法、安全协议相结合为多方数据提供保护隐私的安全计算。从算法应用来说，以不同技术为基础，隐私计算逐渐演化出丰富的算法应用场景。这些应用往往为了实现特定计算目的而组合应用了多种隐私计算技术，可更直接用于实际生产。联邦学习技术方案主要应用于联合建模和预测场景中;多方安全计算和可信执行环境则可作为更加通用的技术方案，可设计用于联合统计、联合查询、联合建模及联合预测等诸多场景。

现有的TEE技术有CSV、ARM TrustZone、Intel SGX、AMD SEV、Intel TDX、ARM CCA等，其中CSV、AMD SEV、Intel TDX、ARM CCA都是基于安全虚拟化方案的TEE技术。ARM Trustzone将每个CPU核拆分成“安全区”和“非安全区”，两个区域通过时分复用的方式隔离占用CPU核，TrustZone提供在两个区域之间的上下文切换机制，非安全区的代码不能访问安全区的代码，需要通过Monitor模式来进行切换，安全区可以直接访问非安全的代码。TrustZone技术主要应用在移动设备的指纹信息保护、身份认证授权等使用场景。Intel SGX通过一组新的指令集扩展与CPU访问控制机制，实现不同程序间的隔离运行，保障用户关键代码和数据的机密性与完整性不受恶意软件的破坏。用户代码调用SGX指令可以创建私有内存区域Enclave，OS、VMM、BIOS、SMM等高特权级代码也无法访问Enclave中的数据。

安全虚拟化技术通过将硬件虚拟化技术和隔离、加密等技术结合，实现一个安全的虚拟机作为可信执行环境。主机不能访问安全虚拟机的私有数据，不同的安全虚拟机之间也不能访问对方的私有数据。安全虚拟机的软件接口和传统软件兼容，不需要额外的软件库或者指令开发TEE程序，极大降低了TEE软件开发的复杂度，是目前的主流TEE技术。归纳各方案的优缺点，可以参照下面的

简表：

TEE	体系结构	安全抽象层级	内存加密	完整性保护	远程证明
Intel SGX	X86	应用程序	支持	支持	支持
AMD SEV/SEV-ES	X86	虚拟机	支持	不支持	支持
AMD SEV-SNP	X86	虚拟机	支持	支持	支持
ARM TrustZone	ARM	安全物理机	不支持	不支持	不支持
Keystone	RISC-V	安全物理机	支持	支持	支持
Intel TDX	X86	虚拟机	支持	支持	支持
ARM CCA	ARM	虚拟机	不支持	不支持	支持
HG CSV1/CSV2	X86	虚拟机	支持	不支持	支持
HG CSV3	X86	虚拟机	支持	支持	支持

二、异构加速

在CPU算力无法满足大规模数据处理性能需求的情况下，隐私计算中通常采用异构处理器进行加速。CSV虚拟机作为CPU可信执行环境，提供CPU可信算力服务，CSV虚拟机直通DCU将可信执行环境拓展到DCU，利用虚拟化隔离技术保护DCU数据不被主机访问。CSV虚拟机与DCU通过密钥协商构建加密的数据传输通道，保护CPU和DCU之间传输数据的安全，CSV虚拟机处理数据的输入和输出，将DCU算法和数据加密后传输给DCU，DCU使用协商的密钥解密后在专有内存完成加速处理，处理结果加密后返回给CSV虚拟机对外输出。整个计算过程在可信执行环境中完成，不需要修改已有的加速模型和隐私计算算法，同时能保证数据和算法安全，可以很好满足隐私计算中大规模数据训练推理、机器学习等高性能业务场景的需求。

三、行业应用

行业	应用场景
金融	金融机构在数据使用过程中存在的风险主要来自两个方面：一是个人用户信息受到的监管要求严格，二是机构自身业务积累的数据资产和商业秘密容易泄露。利用隐私计算，金融机构之间、金融机构同运营商、互联网等平台之间可以在不泄露原始信息的前提下对客户进行联合的精准画像，在信贷评估等场景控制违约风险，提高业务效率。
医疗	医学研究、临床诊断等需要使用大数据统计分析，使用的病人健康数据规模大、价值高，但共享流通却十分困难。诊疗数据往往分布在不同的医疗机构，使用过程中难以管控，加上个人隐私数据的安全保护要求，使得医疗机构不愿意提供自己的数据。利用隐私计算，实现数据可用不可见，可以消除医疗机构对隐私数据泄露的顾虑，充分发挥大规模数据的价值。
政务	政务数据的规模大、种类多、蕴含价值高，涉及公安、交通、税务、环境等各类人民生产生活和社会运行的数据，政务数据的流通与应用将释放巨大能量。近年来，各地政府积极推进政务数据的开放共享，隐私计算技术为政务部门之间、政府与企业之间的数据流通提供安全保障，在企业经营监管、智慧城市建设等领域有广阔的应用前景。