布隆过滤器

最新推荐文章于 2023-12-14 08:45:00 发布

狼与自由

最新推荐文章于 2023-12-14 08:45:00 发布

阅读量90

点赞数

分类专栏： redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013929107/article/details/117406208

版权

redis 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

问题

redis 缓存穿透

有人请求id = -1 的数据
redis中是没有这条数据的，需要去mysql中查，但是数据库也没有这条数据。
查出的结果是null
然后，多次请求id = -1
多级去数据库查询，导致数据库资源浪费

解决思路：
查出 -1的数据为null 也缓存到redis ，下次再请求就可以从缓存取了

这个时候有人请求id = -2 的数据，数据库也没有，于是redis 缓存-2 的数据
然后，-3，-4 .。。。-100000000
如果把查出来为null的都缓存起来，肯定是要浪费redis资源的，而且取数据库查询不存在的数据也是再浪费资源

这个时候需要用到过滤器
先用过滤器查一遍该id是否存在于数据库，如果存在再去数据库里面查，减少数据库查询次数。
但是，如何判断这个id是否存在于数据库呢？
最简单的办法就是把所有存在的id都存在redis里面，然后过滤。
可以这么做，但是如果数据量太大，会浪费内存。
这个时候布隆过滤器就派上用场了

布隆过滤器原理：

用一个bit数组来判断值是否存在。
把一个id 通过hash的方式计算，取到一个值

比如创建一个20位的bit数组20位初始化的时候全部为0.

然后用id=10的数据hash计算出一个hash值 = 1
这个时候数组1的位置上标记为 1

下次有id = 10的请求进来，布隆过滤器一计算 hash值 =1 ，去数组1的位置一看结果是1 ，表示 id=10 是存在的. 返回true

为什么用布隆过滤器，因为占用空间真的少 1千万的数据大概只要1M的内存

布隆过滤器有其缺点：
可能因为hash冲突导致判断失误

比如有id = 100的请求进来，hash后值也是1，这个时候也返回true
这个就是判断错误了。

如何减少错误率？
加大数组长度，
多重hash计算，比如我同一个数用多种不同的方式计算hash值。

总结：
布隆过滤器判断有的，可能不存在。
布隆过滤器判断没有的，一定不存在。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

狼与自由 CSDN认证博客专家 CSDN认证企业博客

码龄11年

86: 原创

2万+: 周排名

2万+: 总排名

7万+: 访问

: 等级

1449: 积分

64: 粉丝

108: 获赞

9: 评论

93: 收藏

私信

关注

热门文章

分类专栏

https 1篇
DDD 1篇
面试 4篇
socket 1篇
大数据 4篇
算法
架构 3篇
Thread 1篇
cpu 1篇
狼与自由 5篇
springCloud 3篇
财富
js 2篇
java 36篇
spring 2篇
mysql 6篇
redis 6篇
docker 1篇

最新评论

微服务组件
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
java 执行方式和类加载过程
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
Redis 计数器和限速器
Tisfy: 总结得十分精辟，就像那：三十功名尘与土，八千里路云和月。
线程状态图
water___Wang: 受教了~
hadoop的集群模式
自由学者亻伊宸: 支持博主，学到了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。