前言
之前我们介绍过两方的「隐私集合求交算法」,可以应用到计算广告的实际效果,寻找联系人,联邦学习的特征对齐等场景,例如:在新的APP上找到共同的微信好友、开会时找到所有参会者共同的空闲时间等,但是这协议是针对两方设计的,没办法安全的扩展到多方。
举个例子:现在有一个会议的发起者,他想要知道自己和其他所有参会者共同的空闲时间来确定会议的时间,一种简单的方案就是会议发起者依次和每一个参会者执行两方的隐私集合求交算法获取到每个参会者和自己的共同空闲时间,再从这些共同时间中筛选出所有参会者都空闲的时间。
但是这种方案有一个很明显的数据安全问题,会议发起者和某一个参会者有两个共同的空闲时间,本周一上午和本周二上午,但是其他所有参会者本周一上午是空闲时间但是本周二上午不是空闲的,这就导致了参会者额外的信息被会议发起者知道了,会议发起者本应该只得到本周一上午这一共同的空闲时间的信息。
本文主要介绍一种简洁高效的「多方隐私集合求交协议」,该协议是针对多方隐私集合求交场景设计的,解决了上述基于两方协议简单扩展到多方时产生的数据安全问题。该协议在CCS '21的[1]-Simple, Fast Malicious Multiparty Private Set Intersection中提出,适用于半诚实无参与方勾结的场景。
相关技术
该协议主要使用不经意键值存储技术和两方隐私集合求交算法进行构建:
▲不经意键值存储
不经意键值存储(OKVS-oblivious key-value store)是指能够在隐藏key和value内容的前提下保留key-vakue映射关系的一种数据结构。有一组键值对{(x1,y_1), (x2,y2), (x3,y3)},那么存在一个OKVS函数f,使得f(x1)=y1, f(x2)=y2, f(x3)=y3, 并且对于其他的键f(x_other)为随机数。
▲两方隐私集合求交
两方隐私集合求交是指在不暴露双方集合交集之外数据的前提下获取交集部分的数据,常用的协议有基于ECDH的,基于OT的和基于同态的,本文介绍的多方隐私集合求交协议对于采用的两方协议不做限制。在前文《悄悄地找到共同点-隐私交集》中已介绍过一种实现方案,故本文中就不再详细讲解。
简单示例
现有A、B、C、D、E五方分别拥有数据集{1,2}、{1,2}、{1,3}、{1,3}、{1,4},他们想要安全的获取他们所有人