O(\rho|Q|)
O(ρ∣Q∣)),当
∣
Q
∣
|Q|
∣Q∣很大的时候(比如
n
2
n^2
n2),这个误差没什么意义,那么我们可以得到大量查询下仍旧有意义的误差吗?
这是可以的,使用boosting技术可以实现一个差分隐私算法,对于每个回答误差大致为
O
(
ρ
n
log
3
/
2
∣
Q
∣
)
O(\rho\sqrt{n}\log^{3/2}|Q|)
O(ρn
log3/2∣Q∣)!并且针对线性查询,该算法运行时间可以变为多项式时间。
算法概述
简单叙述一下这个算法,它有T轮迭代,在每一轮当中,
- 我们根据分布
D
t
\mathcal{D}_t
Dt选出来k个query,然后送到bsg(base synopsis generator)里面,bsg返回对于所有query的回答。
2. 我们对于bsg给出的回答做个评判,然后分别打个分,越准确的回答,对应系数
a
t
,
q
a_{t,q}
at,q约大。
3. 归一化打分,把它作为一个分布更新。
T轮之后,我们得到了
T
∣
Q
∣
T|Q|
T∣Q∣个结果,对于每个query选一个好的回答,返回。
整个算法流程大致就是这样,然后有几个比较有趣的点。
- bsg是什么?bsg有四个参数(
k
k
k,
λ
\lambda
λ,
η
\eta
η,
β
\beta
β),分别构建所需要的查询数量,回答误差,平衡参数,失败概率。代表简单地说,他是一个黑盒,你给他k个query,它就能给你一系列回答,对于这k个query有着比较好的近似。然后有一个事实,如果k个query是从一个分布里选的,那对k个query的良好近似,可以得到对于
∣
Q
∣
|Q|
∣Q∣个query里面重要的(分值高的,或者是分布概率大的)有着良好近似。
2. 和boosting区别在哪?可以看到我们对于回答的质量,并不仅仅用
λ
\lambda
λ来衡量,而是
λ
\lambda
λ和
λ
μ
\lambda+\mu
λ+μ两个阈值来衡量。在中间区域,我们根据回答的误差来更新。以上操作均是因为需要保证DP。
3. 如果你仔细观察
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数网络安全工程师,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年网络安全全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上网络安全知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注网络安全获取)
给大家的福利
零基础入门
对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。
同时每个成长路线对应的板块都有配套的视频提供:
因篇幅有限,仅展示部分资料
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
convert/95608e9062782d28f4f04f821405d99a.png)
同时每个成长路线对应的板块都有配套的视频提供:
因篇幅有限,仅展示部分资料
一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
[外链图片转存中…(img-2sBhxAe7-1712647218045)]