差分隐私简介

\

要点

\\
  • 差分隐私可以通过向聚合查询结果添加随机化\"噪声\"来实现,以保护个人的条目,而不会显著改变查询结果。\\t\\t
  • 差分隐私算法保证攻击者能获取的个人数据几乎和他们从没有这个人记录的数据集中能获取的相差无几。\\t\\t
  • 最简单的算法之一是拉普拉斯机制,可以对聚合查询的结果进行后期处理。\\t\\t
  • 苹果和谷歌分别在iOS和Chrome中使用差分隐私技术。差分隐私算法也已经在隐私保护分析产品中实现,例如由Privitar开发的那些产品。\\t\\t
  • 差分隐私算法仍然是一个活跃的研究领域。\\t\
\\

去年,差分隐私从研究论文一跃成为科技新闻头条,在WWDC主题演讲中,苹果工程副总裁Craig Federighi宣布苹果使用这一概念来保护iOS用户隐私。

\\

这是一个普遍趋势的最新实例:用户和工程师认识到在软件中保护隐私的重要性。备受瞩目的隐私侵犯事件(如Uber的\"上帝模式\")充分地说明了公司员工可以轻易滥用从其客户收集的敏感数据。

\\

被数字化记录的敏感数据的数量正在迅速增加。在支付、交通、导航、购物和健康方面,人们现在比以往更多地依靠数字服务。这种新的数据收集产生了越来越多的方式来侵犯隐私。

\\

如果把数据提供给合适的数据科学家和研究人员,这些数据也能创造令人兴奋的机会——改善交通网络、减少犯罪、治愈疾病。保护数据集中的个人隐私,和对数据加以分析利用来创造更美好的世界,二者之间存在着一种自然的紧张关系。

\\

差分隐私算法是一个有前途的技术解决方案,可以缓解这种紧张,允许分析人员执行良性的聚合分析,同时保证个人隐私得到切实的保护。

\\

这个发展中的技术领域在任何试图分析敏感数据的系统中都值得考虑。虽然差分隐私保证的构想仅仅有十年时间,但它在学术界和工业界已经取得了成功。研究人员正在快速发明和改进差分隐私算法,其中一些已经在苹果的iOS和谷歌的Chrome中采用。

\\

本文讨论了形成当前的差分隐私的历史因素,以及差分隐私的定义和差分隐私算法的示例。然后也讨论了近来一些受到关注的差分隐私算法,这些算法来自谷歌、苹果和其他公司。

\\

背景

\\

数据分析中的隐私保护技术已有数十年的历史,差分隐私算法是这一领域的最新技术。两个早期概念直接影响了差分隐私:

\\
  1. 最小查询集大小\\t
  2. Dalenius的统计披露的定义。\

因为它们为差分隐私提供了有用的背景,我们将首先解释这些概念。

\\

最小查询集大小 第一个概念是最小查询集大小,像差分隐私算法一样,旨在确保聚合查询的安全性。聚合查询是在数据集中的记录子集上计算返回值的查询,例如计数、平均值或总和。将聚合查询视为以\"SELECT SUM\"、\"SELECT COUNT\"或\"SELECT AVG\"开头的SQL查询可能会有所帮助。其他类型的聚合查询包括列联表和直方图。

\\

最小查询集大小是一种约束,旨在确保聚合查询不会泄露有关个人的信息。给定某个配置的阈值量T,其确保每个聚合查询在至少有T个记录的数据集上进行。最小查询集大小会阻止针对少于T个记录的聚合查询

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值