布隆过滤器

最新推荐文章于 2024-04-12 12:59:13 发布

小宇学编程

最新推荐文章于 2024-04-12 12:59:13 发布

阅读量287

点赞数

分类专栏： Redis 文章标签： redis

本文链接：https://blog.csdn.net/Pasiyu/article/details/106609190

版权

Redis 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

set 中会存储每个元素的内容，而布隆过滤器仅仅存储元素的指纹。

概念：布隆过滤器可以理解为一个不怎么精确的 set 结构，当你判断某个对象是否存在时，它可能会误判。（只会误判那些没见过的元素）

基本使用：

布隆过滤器有二个基本指令，bf.add 添加元素，bf.exists 查询元素是否存在，它的用法和 set 集合的 sadd 和 sismember 差不多。注意 bf.add 只能一次添加一个元素，如果想要一次添加多个，就需要用到 bf.madd 指令。同样如果需要一次查询多个元素是否存在，就需要用到 bf.mexists 指令。

127.0.0.1:6379> bf.add codehole user1
(integer) 1
127.0.0.1:6379> bf.exists codehole user1
(integer) 1
127.0.0.1:6379> bf.madd codehole user4 user5 user6
1) (integer) 1
2) (integer) 1
3) (integer) 1
127.0.0.1:6379> bf.mexists codehole user4 user5 user6 user7
1) (integer) 1
2) (integer) 1
3) (integer) 1
4) (integer) 0

设置参数：（影响误判率）

	如果不设置，它在我们第一次 add 的时候自动创建。error_rate是 0.01，默认的initial_size是 100。

	bf.reserve有三个参数，分别是 key, error_rate和initial_size。错误率越低，需要的空间越大。initial_size参数表示预计放入的元素数量，当实际数量超出这个数值时，误判率会上升。

原理：

	每个布隆过滤器对应到 Redis 的数据结构里面就是一个大型的位数组和几个不一样的无偏 hash 函数。所谓无偏就是能够把元素的 hash 值算得比较均匀。

	向布隆过滤器中添加 key 时，会使用多个 hash 函数对 key 进行 hash 算得一个整数索引值然后对位数组长度进行取模运算得到一个位置，每个 hash 函数都会算得一个不同的位置。再把位数组的这几个位置都置为 1 就完成了 add 操作。

	向布隆过滤器询问 key 是否存在时，跟 add 一样，也会把 hash 的几个位置都算出来，看看位数组中这几个位置是否都为 1，只要有一个位为 0，那么说明布隆过滤器中这个 key 不存在。

小宇学编程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器

set 中会存储每个元素的内容，而布隆过滤器仅仅存储元素的指纹。概念：布隆过滤器可以理解为一个不怎么精确的 set 结构，当你判断某个对象是否存在时，它可能会误判。（只会误判那些没见过的元素）基本使用：布隆过滤器有二个基本指令，bf.add 添加元素，bf.exists 查询元素是否存在，它的用法和 set 集合的 sadd 和 sismember 差不多。注意 bf.add 只能一次添加一个元素，如果想要一次添加多个，就需要用到 bf.madd 指令。同样如果需要一次查询多个元素是否存在，就需要用到
复制链接

扫一扫