布隆过滤器

最新推荐文章于 2021-04-20 18:40:23 发布

编程初学者z

最新推荐文章于 2021-04-20 18:40:23 发布

阅读量245

点赞数

分类专栏：数据结构分析

本文链接：https://blog.csdn.net/zy450271923/article/details/106950802

版权

布隆过滤器是一种数据结构，用于在海量数据中高效查询是否存在特定元素，常用于解决缓存穿透问题。它由位数组和哈希函数组成，通过多哈希值确定位数组中位置，存在误判概率但节省空间。在Redis中，可以通过Module扩展使用布隆过滤器。

摘要由CSDN通过智能技术生成

布隆过滤器实际上是一种特殊的数据结构，它能够在海量的数据中查询一个给定的数据是否存在其中。

比如：从1亿的数据中，查询100个数据。这种情况下就可以使用布隆过滤器。
此外，布隆过滤器经常用于解决redis的缓存穿透的问题。
什么是缓存穿透？
就是在高并发的情况下，要查询的某个字段既不存在于redis缓存中，在数据库中也没有，这样所有的请求瞬间全部落在数据库上，导致数据库崩溃。

而通过布隆过滤器可以解决缓存穿透问题。我们将所有可能请求的值存放在布隆过滤器中，当用户请求过来的时候，先判断该值是否存在于布隆过滤器中，如果不存在，直接返回请求参数错误给客户端。存在的话，再从redis和数据库中去查询。

布隆过滤器是如何实现在大数据量中进行快速查询的。布隆过滤器是由一个二进制向量（位数组）和一系列哈希函数组成的数据结构。看上去似乎和HashMap比较相似，但是它比hashMap更加节省空间，效率更高。但是也存在缺点，它返回的结果是一个概率性的，而不是一个准确的结果。

位数组中的每个元素都只占用 1 bit ，并且每个元素只能是 0 或者 1。这样申请一个 100w 个元素的位数组只占用 1000000Bit / 8 = 125000 Byte = 125000/1024 kb ≈ 122kb 的空间。

当我们需要判断一个元素是否存在于布隆过滤器的时候，会进行如下操作：

在这里插入图片描述
布隆过滤器说某个元素存在，小概率会误判。布隆过滤器说某个元素不在，那么这个元素一定不在。

位数组的长度越小，误判的概率就会增加。所以为了减小误判概率，可以增大位数组的长度。

import java.util.BitSet;

public class MyBloomFilter {
   

	//定义一个位数组长度,长为33554432(3000Wbit的位数组)
	private static final int DEFAULT_SIZE = 2<

关注

专栏目录