摘 要 随着物联网和大数据技术的发展,在计算机和手机上出现了大量分布式应用程序.然而现有的分布式数据处理方式已不能很好地满足用户对隐私保护的需求.隐私集合交集(private set intersection, PSI)协议作为一项典型的面向隐私保护的分布式集合计算技术,允许各参与方输入其私有集合,共同计算集合的交集,且不泄露除交集以外的任何信息.PSI协议作为安全多方计算的一种重要应用,已被广泛应用于隐私计算领域,具有重要的理论和实践意义.首先介绍PSI协议的基本密码技术、敌手模型、安全证明、编程框架等基础知识;其次系统总结了构造传统PSI协议的设计框架: 基于公钥加密体制的框架、基于混淆电路的框架、基于不经意传输的框架;随后介绍PSI协议核心的隐私集合元素比较技术/工具: 不经意伪随机函数、不经意多项式评估、布隆过滤器等;进一步地详细阐述了适应新型应用场景的PSI方案: 基于云辅助的PSI、非平衡型PSI、基于阈值的PSI和多方PSI;最后总结并展望面向隐私保护的集合交集计算中亟待解决问题和发展方向.
关键词 隐私集合求交;安全多方计算;隐私保护;不经意传输;混淆电路
随着互联网大数据时代的到来,人们通过对大量分布的数据进行挖掘得到其潜在价值,从而更好地服务于人们,如用户爱好推荐系统、广告精准营销等.然而,在挖掘数据潜在价值的过程中,也会产生个人隐私数据泄露等问题,如英国咨询公司剑桥分析公司在未经Facebook用户同意的情况下获取数百万用户的个人数据.因此,实现数据可用不可见,解决数据协同计算和挖掘过程中的数据安全和隐私保护问题就显得迫在眉睫.相关国家和组织也出台保护隐私数据的法令法规,如《中华人民共和国密码法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》和欧盟《通用数据保护条例》都强调对数据的治理和隐私保护.数据隐私保护已成为学术界和工业界