一.为什么需要使用布隆过滤器?
redis作为一个分布式缓存,可以对热点数据进行存放,减少对于数据库的访问量,
但是使用过程中,可能出现缓存穿透,即请求数据没有在redis中,直接去访问数据库,其实缓存穿透不可怕,大量的缓存穿透才可怕.
发生缓存穿透的原因可能是被攻击了,大量id不存在的数据一直被请求,那我们要处理这种情况也相对比较简单,比如当访问一次id=-1的数据,当其在数据库中不存在时,直接放在redis中,将其值设置为null即可.
但是,当我们的后台的数据量变得非常大时,可能我们要缓存的数据id也会有很多,这个时候就会出现内存问题.
为了解决这个问题,就有一个布隆算法去解决.
二.布隆算法原理:
假如现在有一个长度为10的数组.
我们对每个数据id进行hash,如果结果为n,则将第n个位置值设置为1.
那么当我们向检测某个id是否存在时,就看得出结果得对应位置是否为1即可.
经过此过程,我们能够得出:
如果存在得数据不一定存在
不存在得数据一定不存在
这里面有一个错误率得问题,根本也就是哈希碰撞,即id=002和id=222都会得到同一个hash值.
如果想要降低错误率
有两种方法:
1.增加数组得长度
2.增加hash函数.
也就是对应同一个数用多个hash函数.
redis中使用布隆过滤器得代码演示:
实际演示使用布隆过滤器