布隆过滤器总结

布隆过滤器

作用

①黑名单
②爬虫去重等

公式

m = − n ∗ ln ⁡ p ( ln ⁡ 2 ) 2 m=-\frac{n*\ln p}{(\ln 2) ^2} m=(ln2)2nlnp
m:bit
n:样本量
p:预期失误率(如:万分之一0.0001)
k = ln ⁡ 2 ∗ m n = 0.7 ∗ m n k=\ln 2 *\frac{m}{n}=0.7*\frac{m}{n} k=ln2nm=0.7nm
k:hash函数的个数
( 1 − e − n ∗ k m ) k (1-e^{-\frac{n*k}{m}})^k (1emnk)k

总结

样本量和预期失误率决定bit数组开多大,根据bit数组大小和样本量决定hash函数的个数,把hash函数个数向上取整,最终预期失误率可以到达 ( 1 − e − n ∗ k m ) k (1-e^{-\frac{n*k}{m}})^k (1emnk)k

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值