布隆过滤器

问题

redis 缓存穿透

有人请求id = -1 的数据
redis中是没有这条数据的,需要去mysql中查,但是数据库也没有这条数据。
查出的结果是null
然后,多次请求id = -1
多级去数据库查询,导致数据库资源浪费

解决思路:
查出 -1的数据为null 也缓存到redis ,下次再请求就可以从缓存取了

这个时候有人请求id = -2 的数据,数据库也没有,于是redis 缓存-2 的数据
然后,-3,-4 .。。。-100000000
如果把查出来为null的都缓存起来,肯定是要浪费redis资源的,而且取数据库查询不存在的数据也是再浪费资源

这个时候需要用到过滤器
先用过滤器查一遍该id是否存在于数据库,如果存在再去数据库里面查,减少数据库查询次数。
但是,如何判断这个id是否存在于数据库呢?
最简单的办法就是把所有存在的id都存在redis里面,然后过滤。
可以这么做,但是如果数据量太大,会浪费内存。
这个时候布隆过滤器就派上用场了

布隆过滤器原理:

用一个bit数组来判断值是否存在。
把一个id 通过hash的方式计算,取到一个值

比如创建一个20位的bit数组20位初始化的时候全部为0.

然后用id=10的数据hash计算出一个hash值 = 1
这个时候 数组1的位置上标记为 1

下次有id = 10的请求进来,布隆过滤器一计算 hash值 =1 ,去数组1的位置一看 结果是1 ,表示 id=10 是存在的. 返回true

为什么用布隆过滤器,因为占用空间真的少 1千万的数据大概只要1M的内存

布隆过滤器有其缺点:
可能因为hash冲突导致判断失误

比如有id = 100的请求进来,hash后值也是1,这个时候也返回true
这个就是判断错误了。

如何减少错误率?
加大数组长度,
多重hash计算,比如我同一个数用多种不同的方式计算hash值。

总结:
布隆过滤器判断有的,可能不存在。
布隆过滤器判断没有的,一定不存在。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值