频率估计
-
理论解释:
-
假定数据集中共有 N N N条数据(每个数据非0即1),其中有 x x x个1,则有 N − x N-x N−x个0,通过随机响应处理之后,统计到 s s s个1(求和即可),那么估计原来 N N N条记录中应该有多个1? p p p为不反转的概率。
-
s = x ∗ p + ( N − x ) ∗ ( 1 − p ) s=x*p+(N-x)*(1-p) s=x∗p+(N−x)∗(1−p)
-
x ~ = s + p ∗ N − N 2 ∗ p − 1 \widetilde{x}=\frac{s+p*N-N}{2*p -1} x =2∗p−1s+p∗N−N
-
f ~ = x ~ N = s N + p − 1 2 ∗ p − 1 \widetilde{f}= \frac{\widetilde{x}}{N} =\frac{\frac{s}{N}+p-1}{2*p -1} f =Nx =2∗p−1Ns+p−1
-
记, s N = f \frac{s}{N}=f Ns=f,则
-
f ~ = x ~ N = f + p − 1 2 ∗ p − 1 \widetilde{f}= \frac{\widetilde{x}}{N} =\frac{f+p-1}{2*p -1} f =Nx =2∗p−1f+p−1
-
直方图估计
参考自:
知乎:DPer