【java 一文搞懂什么是布隆过滤器？】

最新推荐文章于 2024-08-03 12:30:52 发布

uutale

最新推荐文章于 2024-08-03 12:30:52 发布

阅读量298

点赞数 5

分类专栏： java面试题文章标签：哈希算法散列表算法 java 面试

本文链接：https://blog.csdn.net/uutale/article/details/139548898

版权

63 篇文章 0 订阅

订阅专栏

布隆过滤器（Bloom Filter）是一种概率型数据结构，它使用位数组和多个哈希函数来判断一个元素是否可能存在于集合中。布隆过滤器主要用于快速检测元素是否存在于集合中，但存在误判率。

假设我们有一个布隆过滤器，它使用3个哈希函数和一个长度为16的位数组。现在我们要向其中添加两个元素“apple”和“banana”。

添加“apple”：
- 使用3个哈希函数对“apple”进行哈希计算，得到3个哈希值：5、9、13。
- 将位数组中索引为5、9、13的位置设为1。
添加“banana”：
- 使用同样的3个哈希函数对“banana”进行哈希计算，得到3个哈希值：2、10、14。
- 将位数组中索引为2、10、14的位置设为1。
  现在，如果我们查询“apple”是否存在，我们会检查索引为5、9、13的位置，发现它们都是1，因此我们可以认为“apple”可能存在于集合中（虽然存在误判的可能性）。

但是，如果我们查询“orange”是否存在，并假设其哈希值为3、6、15，我们会发现索引为6的位置是0，因此我们可以确定“orange”一定不存在于集合中。

布隆过滤器的误判率取决于多个因素，包括位数组的大小、哈希函数的数量以及集合中元素的数量。通常，增加位数组的大小或哈希函数的数量可以降低误判率，但也会增加空间和时间开销。因此，在实际应用中需要根据具体需求进行权衡。

布隆过滤器被广泛应用于各种需要快速判断元素是否存在于集合中的场景，如：

关注