隐私保护计算:数据处于加密或不透明状态下的计算,数据可用不可见。
隐私保护计算架构
隐私保护计算目标
对于隐私信息的全生命周期而言,数据存储和传输阶段的隐私保护方法相对成熟,主要针对数据计算过程和数据计算结果的隐私安全问题。
隐私保护计算技术
隐私保护计算技术包含联邦学习、安全多方计算、机密计算、差分隐私、同态加密等。
联邦学习
- 数据绝对掌控:数据停留本地,数据拥有者自主加入和终止;
- 参与方不稳定:参与方计算和通信差异,如存在延迟,通信代价高,参与方掉线或中途退出等;
- 数据非独立同分布Non IID,如特征分布倾斜、标签分布倾斜、特征相同标签不同、标签相同特征不同等;
- 负载不均衡:参与方拥有的数据量存在很大差异,实现学习公平很难;
联邦平均FedAVG中,通信效率与收敛速率成反比,如何实现通信效率与收敛速率的平衡?
梯度信息泄露原始数据;
纵向联邦学习中,用于实现样本ID对齐的隐私求交(PSI,private set intersection)问题,非交集的样本ID受到保护,但交集内的样本ID存在泄露风险;
基于半同态加密的单向隐私保护问题,私钥解密后即会泄露隐私;
相关内部腐蚀、外部攻击策略;
安全多方计算
- 输入隐私性;
- 正确性:若各个参与方遵守协议,则每个参与方均可以获得正确的计算结果;
- 公平性:若遵守协议的参与方获得了计算结果,则恶意参与方也能获得计算结果,但计算结果可能不正确;
- 结果传递保证:遵守协议的参与方可以获得正确的计算结果。
行为模型:半可信模型;恶意模型;
安全门限:诚实大多数;不诚实大多数;
安全多方计算技术主要有秘密共享(ABY三种秘密共享类型)、不经意传输(OT传输密钥种子,对称密码算法传输扩展的OT消息)、混淆电路(混淆真值表)等。
安全多方计算技术路线:
-
通用安全多方计算:普适,体系庞大,开销较大;
基于全同态加密的通用安全多方计算方案尚处于理论研究阶段; -
特定问题安全多方计算:精心设计协议,开销较小;
机密计算
机密计算是一种基于硬件可信执行环境TEE的技术,旨在实现硬件安全生态;
安全环境相比于普通环境拥有更高的访问权限,实现安全隔离;
差分隐私
背景知识无关的隐私保护模型,实现攻击者背景知识最大化假设;
隐私泄露和隐私保护水平的度量和量化;
本地差分隐私LDP添加噪声量较大,隐私预算较大,数据可用性较低;
同态加密
半同态PHE,部分(浅)同态SWHE,全同态FHE
参考:2020_中国信通院_隐私保护计算技术研究报告