【数据结构】布隆过滤器（Bloom Filter）

码鹿的笔记

已于 2023-09-26 00:27:04 修改

阅读量45

点赞数

分类专栏： # 数据结构与算法文章标签：数据结构

于 2023-09-26 00:25:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/malu_record/article/details/133285469

版权

数据结构与算法专栏收录该内容

4 篇文章 1 订阅

订阅专栏

作用

判断数据可能存在 或 一定不存在。

好处

增加和查询元素的时间复杂度O(N)
布隆过滤器不存储元素本身，占用小，保密性强

缺点

存在误判，bit数组占用率越高，误判率越高；无法获取元素本身，很难删除元素

原理

1、Bit数组存储数据

| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |

2、Key多次Hash，获取Bit数组下标

key值经过三次hash获得三个下标，这三个位置的元素设置为 1 。
| 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |

3、查询KEY

根据Key 进行hash运算三个下标，查询三个元素是否都为1，都为1表示可能存在，存在0表示一定不存在。

4、误判率

存储 Key越多， 也就代表 Bit数组 1 越多 ， 0 越少， 误判率也就 越高。

例子：

有一个12位bit数组，存储50个key之后，bit数组元素均为1
| 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |

那么这时候，无论查询什么新的Key，都会返回三个1。

解决：

可以 适当增加Bit数组长度 ， 降低误判率 。

删除KEY

由于布隆过滤的实现和hash冲突，很难删除布隆过滤的key。
一般是重新进行查询计算布隆过滤器的数据。
如果需要删除，可以给每个Bit元素添加计数器，删除一个key就给三个元素的计数减1。（可参考 Counting Bloom Filter）

使用场景

1、缓存穿透
2、黑名单过滤
3、URL去重

相关

布谷过滤器（Cuckoo Filter

码鹿的笔记

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【数据结构】布隆过滤器（Bloom Filter）

判断数据或。增加和查询元素的时间复杂度布隆过滤器。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码鹿的笔记 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。