布隆过滤器

最新推荐文章于 2024-07-13 13:55:40 发布

qq_42455789

最新推荐文章于 2024-07-13 13:55:40 发布

阅读量64

点赞数

文章标签：过滤器 java redis

本文链接：https://blog.csdn.net/qq_42455789/article/details/118540965

版权

布隆过滤器（Bloom Filter）

布隆过滤器思想
如何解决hash冲突
布隆过滤器的数据结构
缺点
优点
应用

布隆过滤器思想

如果想判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。链表，树等等数据结构都是这种思路.。但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢。不过世界上还有一种叫作散列表（又叫哈希表，Hash table）的数据结构。它可以通过一个Hash函数将一个元素映射成一个位阵列（Bit Array）中的一个点。这样一来，我们只要看看这个点是不是 1 就知道可以集合中有没有它了。

如何解决hash冲突

使用多个 Hash，如果它们有一个说元素不在集合中，那肯定就不在。如果它们都说在，虽然也有一定可能性它们在说谎，不过直觉上判断这种事情的概率是比较低的。

布隆过滤器的数据结构

布隆过滤器是一个 bit 向量或者说 bit 数组，如果我们要映射一个值到布隆过滤器中，我们需要使用多个不同的哈希函数生成多个哈希值，并对每个生成的哈希值指向的 bit 位置 1，例如针对值 “baidu” 和三个不同的哈希函数分别生成了哈希值 1、4、7，则上图转变为：
在这里插入图片描述我们现在再存一个值 “tencent”，如果哈希函数返回 3、4、8 的话，图继续变为：

值得注意的是，4 这个 bit 位由于两个值的哈希函数都返回了这个 bit 位，因此它被覆盖了，如果需要查询 “baidu” 这个值是否存在的话，那么哈希函数必然会返回 1、4、7，通过检查发现这三个 bit 位上的值均为 1，只能说 “baidu” 这个值可能存在，因为随着增加的值越来越多，被置为 1 的 bit 位也会越来越多，这样某个值 “taobao” 即使没有被存储过，但是万一哈希函数返回的三个 bit 位都被其他值置位了 1 ，那么程序还是会判断 “taobao” 这个值存在

缺点

1.一般情况下不能从布隆过滤器中删除元素。我们很容易想到把位列阵变成整数数组，每插入一个元素相应的计数器加1, 这样删除元素时将计数器减掉就可以了。因为我们必须保证删除的元素的确在布隆过滤器里面，但这一点单凭这个过滤器是无法保证的

2.算法判断key在集合中时，有一定的概率key其实不在集合中

3.大佬们正在想办法解决删除问题

优点

相比于其它的数据结构，布隆过滤器在空间和时间方面都有巨大的优势。布隆过滤器存储空间和插入/查询时间都是常数。布隆过滤器不需要存储元素本身，在某些对保密要求非常严格的场合有优势。

应用

1.Google 著名的分布式数据库 Bigtable 使用了布隆过滤器来查找不存在的行或列，以减少磁盘查找的IO次数

2.Google Chrome浏览器使用了布隆过滤器加速安全浏览服务

qq_42455789

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器

布隆过滤器（Bloom Filter）布隆过滤器思想如何解决hash冲突布隆过滤器的数据结构缺点优点应用布隆过滤器思想如果想判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。链表，树等等数据结构都是这种思路.。但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢。不过世界上还有一种叫作散列表（又叫哈希表，Hash table）的数据结构。它可以通过一个Hash函数将一个元素映射成一个位阵列（Bit Array）中的一个点。这样一来，我们只要看看这个点是
复制链接

扫一扫