Redis之布隆过滤

典型场景:

1、智能推荐,过滤用户已经看过的内容

2、爬虫系统,过滤已经爬过的网址

3、NoSQL 数据库领域,过滤大量不存在的row请求

4、邮箱系统,垃圾邮件过滤

 

默认的error_rate是 0.01

默认的initial_size是 100

 

这2个参数可以通过bf.reserve进行设置,用来控制误差率。

错误率越低,需要的空间越大。initial_size参数表示预计放入的元素数量,当实际数量超出这个数值时,误判率会上升。

实现原理:

 

每个布隆过滤器对应到 Redis 的数据结构里面就是一个大型的位数组和几个不一样的无偏 hash 函数。所谓无偏就是能够把元素的 hash 值算得比较均匀。

比如对于一个key,通过几个无偏hash函数进行运算,取模位图数组长度,得到了几个位图位置,然后全部设为1;

产生偏差原因:

多个不同的key,设置的位图位置有空能会有交叉,如果一个key的所有位图位置都被其他的key设置过了,布隆过滤器会认为这个key已经存在了;实际上这个key还没有设置过

也就是说:判断key是否存在,返回存在,实际上不一定存在,有误差

如果一个key所对应的位图位置种,有为0的存在,那这个位图肯定没有设置过

所以:判断key是否存在,返回不存在,那就一定不存在

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值