Redis之布隆过滤

最新推荐文章于 2022-10-01 11:07:37 发布

浪尖赏花

最新推荐文章于 2022-10-01 11:07:37 发布

阅读量146

点赞数

分类专栏： redis 文章标签： redis 布隆过滤

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lihui_shine/article/details/113659382

版权

redis 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

典型场景：

1、智能推荐，过滤用户已经看过的内容

2、爬虫系统，过滤已经爬过的网址

3、NoSQL 数据库领域，过滤大量不存在的row请求

4、邮箱系统，垃圾邮件过滤

默认的error_rate是 0.01

默认的initial_size是 100

这2个参数可以通过bf.reserve进行设置，用来控制误差率。

错误率越低，需要的空间越大。initial_size参数表示预计放入的元素数量，当实际数量超出这个数值时，误判率会上升。

实现原理：

每个布隆过滤器对应到 Redis 的数据结构里面就是一个大型的位数组和几个不一样的无偏 hash 函数。所谓无偏就是能够把元素的 hash 值算得比较均匀。

比如对于一个key，通过几个无偏hash函数进行运算，取模位图数组长度，得到了几个位图位置，然后全部设为1；

产生偏差原因：

多个不同的key，设置的位图位置有空能会有交叉，如果一个key的所有位图位置都被其他的key设置过了，布隆过滤器会认为这个key已经存在了；实际上这个key还没有设置过

也就是说：判断key是否存在，返回存在，实际上不一定存在，有误差

如果一个key所对应的位图位置种，有为0的存在，那这个位图肯定没有设置过

所以：判断key是否存在，返回不存在，那就一定不存在

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Redis之布隆过滤

典型场景：1、智能推荐，过滤用户已经看过的内容2、爬虫系统，过滤已经爬过的网址3、NoSQL 数据库领域，过滤大量不存在的row请求4、邮箱系统，垃圾邮件过滤默认的error_rate是 0.01默认的initial_size是 100这2个参数可以通过bf.reserve进行设置，用来控制误差率。错误率越低，需要的空间越大。initial_size参数表示预计放入的元素数量，当实际数量超出这个数值时，误判率会上升。实现原理：每个布隆过滤器对...
复制链接

扫一扫

专栏目录

浪尖赏花 CSDN认证博客专家 CSDN认证企业博客

码龄17年

17: 原创

23万+: 周排名

194万+: 总排名

3万+: 访问

: 等级

536: 积分

167: 粉丝

4: 获赞

3: 评论

3: 收藏

私信

关注

热门文章

分类专栏

redis 1篇
ajax 1篇
java
javascript 7篇
oracle 3篇
无线通信 1篇
android 3篇

最新评论

页面游戏--扫雷
ws_hgo: 亲情啊！说错啦呵呵
页面游戏--扫雷
ws_hgo: 亲戚啊！[e03]
createElement创建控件时的name属性设置问题
gghunter: 主要是应为标准规定了除表单控件外大部分标签(除外：object，img,a,就带有name属性)不可以带name，只有表单控件才带name属性，比如：input,button等等（主要还是因为用它来提交数据），所以其他标签无法设置name。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。