布隆过滤器、布谷过滤器

最新推荐文章于 2024-05-16 15:18:59 发布

～一叶、

最新推荐文章于 2024-05-16 15:18:59 发布

阅读量377

点赞数

分类专栏：计算机基础文章标签：布隆过滤器缓存穿透

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songcf_faith/article/details/124569017

版权

计算机基础专栏收录该内容

10 篇文章 0 订阅

订阅专栏

布隆过滤器(Bloom Filter)

布隆过滤器说某个元素存在，小概率会误判。布隆过滤器说某个元素不在，那么这个元素一定不在。

优点

占用空间更少并且效率更高（位数组中的每个元素都只占用 1 bit ，并且每个元素只能是 0 或者 1，100w 个元素约122kb ）

缺点

1.其返回的结果不是精确的，理论情况下添加到集合中的元素越多，误报的可能性就越大。
2.并且存放在布隆过滤器的数据不容易删除。

增强

bitmap更换成数组,当数组某位置被映射一次时就+1,当删除时就-1,这样就避免了普通布隆过滤器删除数据后需要重新计算其余数据包Hash的问题,但是依旧没法避免误判。

布隆过滤器使用场景

海量数据处理，判断一个数字是否存在于包含大量数字的数字集中（数字集很大，5 亿以上！）
防止缓存穿透（判断请求的数据是否有效避免直接绕过缓存请求数据库）
邮箱的垃圾邮件过滤
黑名单功能
去重（比如爬给定网址的时候对已经爬取过的 URL 去重）
【Redis 中的布隆过滤器、Google 开源的 Guava 中自带的布隆过滤器】

布谷过滤器（Cuckoo Filter）

因为布隆顾虑器无法删除，导致后续精确性不断的降低，为了解决布隆过滤器不能删除元素的问题，布谷鸟过滤器横空出世。

布谷鸟过滤器和布谷鸟哈希结构一样，它也是一维数组，但是不同于布谷鸟哈希的是，布谷鸟哈希会存储整个元素，而布谷鸟过滤器中只会存储元素的指纹信息（几个bit，类似于布隆过滤器）。这里过滤器牺牲了数据的精确性换取了空间效率。正是因为存储的是元素的指纹信息，所以会存在误判率，这点和布隆过滤器如出一辙。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器、布谷过滤器

布隆过滤器及用途
复制链接

扫一扫

专栏目录

～一叶、 CSDN认证博客专家 CSDN认证企业博客

码龄9年

117: 原创

7万+: 周排名

190万+: 总排名

15万+: 访问

: 等级

1901: 积分

35: 粉丝

53: 获赞

8: 评论

223: 收藏

私信

关注

热门文章

分类专栏

Java 14篇
思维模型 10篇
中间件 9篇
docker 6篇
计算机基础 10篇
Android/iOS 10篇
cocos2d-x v2/v3 32篇
cocos2d-x lua/js 12篇
erlang 3篇
JavaScript 2篇
C/C++/VC编程 9篇
解题&算法 7篇

最新评论

业务关键路径最小成本试错《精益创业》
CSDN-Ada助手: 非常感谢CSDN博主分享的《业务关键路径最小成本试错》，这篇博客让我深受启发。我觉得下一篇博客可以围绕《精益创业》的理念，分享如何在项目开发中运用精益思想，帮助团队更高效地完成任务。这样的技术文章对其他用户也会有很大的帮助。期待你的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Docker技术原理之Linux UnionFS（容器镜像）
Linux猿: 很清晰！
Docker技术原理之Linux UnionFS（容器镜像）
渭水飞熊: 写的确实好，思路清晰，例子也全面。
Docker技术原理之Linux Namespace（容器隔离）
许愿35岁退休: 赞
Docker技术原理之Linux UnionFS（容器镜像）
陈酒尽余欢: 老铁, 写得好

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。