什么是布隆过滤器
本质上布隆过滤器是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。
相比于传统的 List、Set、Map 等数据结构,它更高效、占用空间更少,但是缺点是其返回的结果是概率性的,而不是确切的。
布隆过滤器可以做什么
上面说了布隆过滤器可以告诉你某个东西一定不存在和可能存在
一定不存在?很多的使用都是利用布隆过滤器一定不存在的这个特性来进行的。
HashMap
当然这种功能也可以使用HashMap来完成,但是在数据量很小的情况下是可行的,在海量数据下,就不能支撑了,就得靠这篇博客里的主角布隆过滤器
缓存问题
在项目中肯定会使用到缓存,就以redis为例,当前端发送大量恶意请求的时候,导致查不到redis缓存,然后请求就到了数据库,把数据库干崩了,也是我们常说的redis的穿透,这种情况下布隆过滤器就是一个很好的选择。
其实只要是遇到符合布隆过滤器特性的就可以使用它
布隆过滤器原理
布隆过滤器是一个叫“布隆”的人提出的,它本身是一个很长的二进制向量,既然是二进制的向量,那么显而易见的,存放的不是0,就是1。
现在我们新建一个长度为16的布隆过滤器,默认值都是0,就像下面这样: