问题
redis 缓存穿透
有人请求id = -1 的数据
redis中是没有这条数据的,需要去mysql中查,但是数据库也没有这条数据。
查出的结果是null
然后,多次请求id = -1
多级去数据库查询,导致数据库资源浪费
解决思路:
查出 -1的数据为null 也缓存到redis ,下次再请求就可以从缓存取了
这个时候有人请求id = -2 的数据,数据库也没有,于是redis 缓存-2 的数据
然后,-3,-4 .。。。-100000000
如果把查出来为null的都缓存起来,肯定是要浪费redis资源的,而且取数据库查询不存在的数据也是再浪费资源
这个时候需要用到过滤器
先用过滤器查一遍该id是否存在于数据库,如果存在再去数据库里面查,减少数据库查询次数。
但是,如何判断这个id是否存在于数据库呢?
最简单的办法就是把所有存在的id都存在redis里面,然后过滤。
可以这么做,但是如果数据量太大,会浪费内存。
这个时候布隆过滤器就派上用场了
布隆过滤器原理:
用一个bit数组来判断值是否存在。
把一个id 通过hash的方式计算,取到一个值
比如创建一个20位的bit数组20位初始化的时候全部为0.
然后用id=10的数据hash计算出一个hash值 = 1
这个时候 数组1的位置上标记为 1
下次有id = 10的请求进来,布隆过滤器一计算 hash值 =1 ,去数组1的位置一看 结果是1 ,表示 id=10 是存在的. 返回true
为什么用布隆过滤器,因为占用空间真的少 1千万的数据大概只要1M的内存
布隆过滤器有其缺点:
可能因为hash冲突导致判断失误
比如有id = 100的请求进来,hash后值也是1,这个时候也返回true
这个就是判断错误了。
如何减少错误率?
加大数组长度,
多重hash计算,比如我同一个数用多种不同的方式计算hash值。
总结:
布隆过滤器判断有的,可能不存在。
布隆过滤器判断没有的,一定不存在。