布隆过滤器

我们平时在查询一个元素是否存在一个集合中

一般想到的是set、map、list

但是都会存储起来再做判断,效率会受到影响

bloom filter 是一种概率型数据结构

插入和查询效率都很高,缺点不易删除

布隆过滤器是一个bit数组或者bit向量,值为0或者1

当元素存储进去布隆过滤器的时候,会通过几个哈希函数映射在数组上个某个位置,标记为1,比如存储baidu这个元素

当查询元素是否存在的时候,元素通过哈希函数,如果映射在bit数组上的位置不都为1,则肯定不存在

而当都为1时,则有可能存在

布隆过滤器存在概率偏差

误差是可以调整的,但却存在,所以存在布隆过滤器变种

哈希函数个数选择:

False positives 概率推导见:https://www.cnblogs.com/liyulong1982/p/6013002.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值