首先什么是缓存击穿?
查询一个在缓存内必然不存在的数据,导致每次请求都要去存储层去查询,这样缓存就失去了意义。如果在大流量下数据库可能挂掉。
那什么是布隆过滤器?
它的核心是一个很长的二进制向量和一系列的hash函数。
比如我现在有三个商品存在数据库中,那么我就有三个商品id,如果直接查库,那么存在缓存击穿,(假如所查询的商品id压根不存在)
那么要如何解决缓存击穿呢?
显然关键就是对于不存在的id,不要让系统查库,能够通过内存拦截
即,利用布隆过滤器,过滤掉数据库中压根不存在的商品id
做法是:
对商品id做hash和取余运算,使商品id的范围在布隆过滤器的长度内,然后如果这个商品id被存过库,那么布隆过滤器中的某一位将被置为1,(0代表不存在)
举个例子,比如我们已经存过三个商品id 布隆过滤器的长度是10
那么布隆过滤器的内容可能是这样的:
0001000110
其中有三位是1,代表那存在的三个商品id
当然了,存在hash冲突的问题
也存在不能删除的问题(如果某一位置0,置0的这一位可能代表多个商品id)
so
布隆过滤器的优缺点显而易见:
优点:避免了缓存击穿
缺点:只能保证存在,不能保证不存在 且使用久了误判率会升高,需要周期性的清0