关于RAPPOR

rappor是谷歌研发的用于收集用户回答的LDP协议,例如 设定哪个页面为浏览器的homepage、搜索引擎等。
LDP的一个基本目标是频度估计
LDP的协议基本可以分为三个步骤:编码、随机化、聚集

文中提到的攻击:heavy hitter identification 和 frequent itemset mining

Basic rappor

basic rappor也是这三个步骤
编码使用的是一元编码、扰动分为两个部分:永久和顺时==(?)== 聚集中的==-1/2fn==

permanent randomized response的作用

本地化差分隐私保护技术首先在每个用户端对个人数据进行隐私化处理,如Tom 将以40%的概率提交“艾滋病”,分别以10%的概率提交其余 6 种疾病,如此一来,Tom 所提交的数据就具有了一定的随机性,从而保护了敏感信息。
这里应该就是昨天看的那个spinner的意思了吧

永久扰动,只执行一次。目前看到过两种写法
在这里插入图片描述
这篇是2017年的软件学报综述中所用的

在这里插入图片描述
这个是Locally Differentially Private Protocols for Frequency Estimation中所给的,这里1-1和0-0的概率是相同的 都是1-1/2f

但是具体为什么要有一个永久的扰动呢?
每次报告值 V 时,都重用位向量 B,使用瞬时随机响应计算长度为 k 的实际响应位向量 S 瞬时随机响应是利用随机响应参数 p,q 扰动 B′的每一位得到实际响应位向量。
是否是每次都是直接扰动的话多次会推测出原值?
这里需要看下代码或看跑出来的结果吧

瞬时扰动
在这里插入图片描述
这里1-1是p 0-1是q p + q = 1
0-1是1-q 1-0是1-p 可是 这也是对称吗
扰动后再发给aggregator

在这里插入图片描述
这里为什么要-1/2fn啊

rappor

basic rapor对数据维度较大时表现的不是很好,所以rappor采用bloom filter, bloom filter其实是一种 判断含有某个元素的数据结构。Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom Filter通过极少的错误换取了存储空间的极大节省。(这里是别人的笔记写的)

隐私里为什么要用bloom filter 文中解释是 membership testing 有道理,这也是rappor和basic rappor之间的区别吧,rappor的motiation中也有这一点。
rappor 也是三个步骤

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值