【布隆过滤器的原理及应用场景】

最新推荐文章于 2024-03-16 21:24:30 发布

九张算数

最新推荐文章于 2024-03-16 21:24:30 发布

阅读量318

点赞数

分类专栏：数字工匠文章标签：大数据 servlet erlang 编辑器哈希算法

本文链接：https://blog.csdn.net/zhang9880000/article/details/129130955

版权

数字工匠专栏收录该内容

39 篇文章 1 订阅

订阅专栏

这里写自定义目录标题

布隆过滤器原理及应用

布隆过滤器原理及应用

布隆过滤器（Bloom Filter）是一种快速的数据结构，用于判断一个元素是否在集合中。它的主要优点是空间效率和查询速度非常高，但是它的缺点是可能存在一定的误判率。

布隆过滤器使用一个比特数组和一组哈希函数来表示集合。假设有n个元素要存储到布隆过滤器中，它会使用k个不同的哈希函数将每个元素映射到比特数组中的k个位置上，每个位置都被标记为1。当查询一个元素时，它会将这个元素通过k个哈希函数计算出k个位置，然后判断这些位置上的比特值是否都为1，如果都为1，则说明该元素很可能在集合中，但如果有任何一个位置上的比特值为0，则说明该元素一定不在集合中。

下面是一个简单的例子，假设我们要将3个元素“apple”、“banana”和“orange”存储到一个布隆过滤器中，它使用2个哈希函数和一个比特数组（长度为10）来表示集合。

第一个哈希函数将元素映射到比特数组的位置： $hash_1(x) = (|x| + 3) \mod 10$ ，其中 $∣ x ∣$ 表示元素的长度。例如，对于元素“apple”， $hash_1("apple") = (5 + 3) \mod 10 = 8$ 。

第二个哈希函数将元素映射到比特数组的位置： $hash_2(x) = (2|x| + 1) \mod 10$ 。例如，对于元素“apple”， $hash_2("apple") = (2\times5 + 1) \mod 10 = 1$ 。

将元素“apple”、“banana”和“orange”分别通过这两个哈希函数计算，得到它们在比特数组中的位置如下所示：
在这里插入图片描述
由于布隆过滤器只是一个位数组，因此它的内存占用非常小，同时检查一个元素是否在集合中的时间复杂度为 O(k)，其中 k 是哈希函数的个数。这使得布隆过滤器非常适合于以下场景：