布隆过滤器的原理，优缺点

C位出道_2022

已于 2022-02-13 17:58:20 修改

阅读量1k

点赞数 1

分类专栏： Redis 文章标签： redis

于 2021-10-25 16:25:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53611007/article/details/120953964

版权

Redis 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

布隆过滤器是干什么的？

我们的项目常会用到redis作为缓存，极大提高数据库的效率，但是这里有一个问题：缓存穿透

什么是缓存穿透：缓存穿透说简单点就是大量请求的 key 根本不存在于缓存中，导致请求直接到了数据库上，根本没有经过缓存这一层。举个例子：某个黑客故意制造我们缓存中不存在的 key 发起大量请求，导致大量请求落到数据库

布隆过滤器在很大成都上可以解决这种问题

做法大致是：把所有可能存在的请求的值都存放在布隆过滤器中，当用户请求过来，先判断用户发来的请求的值是否存在于布隆过滤器中。不存在的话，直接返回请求参数错误信息给客户端，存在的话去redis缓存中查数据

其实布隆过滤器也可能出现误判，总的来说： 布隆过滤器说某个元素存在，小概率会误判。布隆过滤器说某个元素不在，那么这个元素一定不在。

为什么呢？

我们先看一下布隆过滤器是如何实现添加和查询数据的

添加数据：

使用布隆过滤器中的哈希函数对元素值进行计算，得到哈希值（有几个哈希函数得到几个哈希值）。
根据得到的哈希值，在位数组中把对应下标的值置为 1。

查询数据：

对给定元素再次进行相同的哈希计算；
得到值之后判断位数组中的每个元素是否都为 1，如果值都为 1，那么说明这个值在布隆过滤器中，如果存在一个值不为 1，说明该元素不在布隆过滤器中。

即使使用多个hash函数来减少hash碰撞了，但是任然有可能出现hash碰撞，因为不同的字符串可能哈希出来的位置相同 ，从而导致误判，了解hashmap源码的同学对这里应该是很好理解的，不过多赘述了

我的另一篇博客用java实现了非常简单的布隆过滤器：

用java实现一个非常简单的布隆过滤器_m0_53611007的博客-CSDN博客

优点：

1.占用内存小

2.增加和查询元素的时间复杂度为：O(k)，(k为哈希函数的个数，一边比较小)，与数据量大小无关

3.哈希函数相互之间没有关系，方便硬件并行运算

4.布隆过滤器不需要存储元素本身，在某些对保密要求比较严格的场合有很大优势

5.数据量很大时，布隆过滤器可以表示全集

6.使用同一组散列函数的布隆过滤器可以进行交、并、差运算

缺点：

1.误判率，即存在假阳性(False Position)，不能准确判断元素是否在集合中(概率较小)

2.不能获取元素本身

3.一般情况下不能从布隆过滤器中删除元素

C位出道_2022

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。