差分隐私随笔

本文介绍了差分隐私作为隐私保护的重要手段,包括抑制、泛化、置换、扰动和裁剪等方法。重点讨论了差分隐私的概念,强调其不受攻击者能力限制,能严格保证用户隐私的安全性。拉普拉斯机制和指数机制是实现差分隐私的常见方法,适用于不同类型的查询。此外,文章还提到了本地差分隐私(LDP)的特点和应用,如Rappor协议和SH协议,以及它们在处理大数据隐私保护中的作用。最后,文中探讨了基于差分隐私的轨迹隐私保护方法,包括集中式和本地差分隐私的轨迹保护策略。
摘要由CSDN通过智能技术生成

隐私保护手段包括:抑制(suppression)、泛化(generalization)、置换(permutation)、扰动(perturbation)、裁剪(anatomy)等。

1.抑制:最常见的数据匿名措施,通过将数据置空的方式限制数据发布。

2.泛化:通过降低数据精度来提供匿名方法。属性泛化即通过制定泛化规则,使得多个元组的在规则下近似的取值相同。最深的属性泛化效果通常等同于抑制。社交关系数据的泛化则是将某些节点以及这些节点间的连接进行泛化。位置轨迹数据可进行时间、空间泛化。

3.置换:不对数据内容作更改,但是改变数据的属主。

4.扰动:在数据发布时添加一定的噪音,包括数据增删、变换等。

5.裁剪:将数据分开发布。


显示标识符(Explicit Identifier):能唯一标识单一个体的属性,如身份证号,姓名等。

准标识符(QID,Quasi-Identifier):联合起来就能唯一标识一个人的多个属性,如邮编,生日,性别等联合起来则可能是准标识符。

敏感属性(Sensitive Attribute):包含隐私数据的属性,如疾病,薪资等。


k-匿名:

背景:即便去除了表中的身份ID等标志性信息,攻击者仍可凭借背景知识,如地域、性别等准标识符信息,迅速确定攻击目标对应的记录。此类攻击称为记录链接(record linkage)攻击。

定义:令T()为一张具有有限行的表,属性集合为{ }。Q为表中的准标识符Q={ }。表T满足K-匿名,当且仅当每一组准标识符的取值序列在T[QI]中出现至少k次。

L-多样化、T-贴近,M-不变性等。

社交图谱的隐私保护:节点匿名、边匿名、属性匿名。

位置轨迹隐私保护:

面向  基于位置的服务(Location Based Service,LBS)应用的隐私保护:Mix-zone在路网中的应用、隐私信息检索(PIR)在近邻查询中的应用。

隐私信息检索(private information retrievalPIR

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值