布隆过滤器

BK俊河

已于 2024-09-15 19:44:58 修改

阅读量245

点赞数 6

分类专栏： Redis知识点总结文章标签： redis 缓存

于 2024-09-15 19:42:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Junhe4512/article/details/142287584

版权

Redis知识点总结专栏收录该内容

5 篇文章 0 订阅

订阅专栏

布隆过滤器（Bloom Filter）是一种空间效率极高的概率型数据结构，用于判断某个元素是否属于一个集合。布隆过滤器的核心特性是：可能误判某个元素存在，但绝不会误判某个元素不存在。

布隆过滤器的工作原理

布隆过滤器的主要由一个位数组和若干个哈希函数组成

位数组：这是布隆过滤器的核心存储，长度为 m 的位数组，每个元素的值是 0 或 1。初始时，位数组中所有位置都设置为 0。

多个哈希函数：布隆过滤器使用 k 个不同的哈希函数，每个哈希函数能够将输入的元素映射到位数组的一个位置（范围在 0 到 m-1 之间）。这些哈希函数需要尽可能均匀和独立地将输入映射到不同的位。

插入操作

当插入一个元素到布隆过滤器时：

使用 k 个哈希函数分别计算该元素的哈希值，每个哈希函数会返回一个位数组中的索引位置。
将这些哈希值对应的位数组位置都设置为 1。

查询操作

当查询一个元素是否存在时：

同样使用 k 个哈希函数计算该元素的哈希值，得到对应的 k 个位数组索引。
检查这些索引对应的位数组位置是否都是 1：

如果全是 1，则判断该元素可能存在（存在一定误判几率，即假阳性）。
如果有任何一个位置是 0，则判断该元素一定不存在。

优缺点

优点

节省空间：在需要快速判断元素是否存在而不需要记录元素的详细信息时，布隆过滤器能大大减少内存开销。
插入和查询效率高：插入和查询的时间复杂度是常数 O(k)，其中 k 是哈希函数的数量，通常较小。
不需要存储元素本身：只需存储位数组，大大节约空间。

缺点

存在误判率：布隆过滤器可能误判某些不存在的元素为存在，这就是假阳性问题。
不可删除元素：由于哈希碰撞，无法单独删除一个元素。
不支持动态扩展：布隆过滤器的位数组大小需要在初始化时设定，且无法动态调整。

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。