布隆过滤器

最新推荐文章于 2024-10-02 00:05:48 发布

敲去吧你个垃圾

最新推荐文章于 2024-10-02 00:05:48 发布

阅读量365

点赞数 11

分类专栏：日积月累文章标签：数据结构哈希算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/X_T_X_/article/details/135672128

版权

日积月累专栏收录该内容

5 篇文章 0 订阅

订阅专栏

布隆过滤器

应用场景，用来判断一个元素是否存在与包含大量元素的集合中。

可以快速知道一定不存在或者可能存在

我们可以把布隆过滤器当成由一个较大的bit array（位数组）和几个哈希函数组成的数据结构。

为什么不用现有的List，Map，Set这些数据结构呢？

因为它占用的空间更少，仅是一个01的二进制数组，效率更高。但是缺点就是会出现误判。

为什么判断可能存在会误判呢？

因为当一个元素加入布隆过滤器的时候，要经过两步：

该元素调用布隆过滤器中的哈希函数，得到几个哈希值。
将位数组的下标为相应哈希值的位置为 1。

那么当使用布隆过滤器判断一个元素是否存在也要经过两步：

该元素进行相同的哈希计算得到相同的哈希值。
在位数组中查找以这些哈希值位下标的位是不是1，均为1表示该元素可能存在，有一个为0，则该元素一定不存在。

那么通过判断计算出的哈希值所在位的值为1，就判断是否存在。很可能会存在某个位置上的1是别的元素添加时设置为1的。

如下图：

在布隆过滤器中添加元素key1：

在这里插入图片描述

在布隆过滤器中添加元素key2：

在这里插入图片描述

那么此时我们没有添加key3元素，但是如果key3通过两个hash函数的计算得出的值为1，2。那么布隆过滤器也会判断key3存在。从而出现了误判。

在这里插入图片描述

所以显然布隆过滤器的长度和哈希函数的个数设置要合适：

bit位的长度不能太短，不然很快就会都被置为1.
哈希函数个数不能太多，导致bit位置为1的速度过快，并且太多的哈希函数会降低布隆过滤器的效率
数个数不能太多，导致bit位置为1的速度过快，并且太多的哈希函数会降低布隆过滤器的效率
哈希函数也不能太少，会导致误报率变高。

敲去吧你个垃圾

关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

敲去吧你个垃圾 CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

86万+: 周排名

20万+: 总排名

1万+: 访问

: 等级

288: 积分

53: 粉丝

73: 获赞

8: 评论

70: 收藏

私信

关注

热门文章

分类专栏

日积月累 5篇

最新评论

＜学习笔记＞ Nacos配置管理
qingyuCode: 说了和没说一样，黑马教出来的学生都一个样
StringBuffer为什么比String快
CSDN-Ada助手: 恭喜您写完了第15篇博客！标题“StringBuffer为什么比String快”非常吸引人，我很期待阅读您的观点和分析。持续创作是非常了不起的，您的努力和热情让读者受益匪浅。如果我有一个谦虚的建议的话，我会建议您在下一篇博客中探讨一下字符串拼接的优化策略，或者分享一些关于字符串处理的其他技巧和经验。期待您的下一篇作品！
@RequestBody的作用
CSDN-Ada助手: 恭喜您写了第14篇博客！非常高兴看到您一直保持创作的动力。标题为“@RequestBody的作用”的博客内容一定非常有深度。不过，我谦虚地建议您在接下来的创作中，可以考虑从实际应用场景出发，深入探讨@RequestBody在不同框架中的使用方法和技巧，以及与其他相关注解的配合运用。这样的创作方式会更加吸引读者，并提供更多实用的知识。期待您的下一篇博客，再次祝贺您！
＜学习笔记＞ Gateway网关学习
CSDN-Ada助手: 恭喜您写了第20篇博客，标题看起来很有深度！Gateway网关学习是个非常有趣的主题，我很期待阅读您的学习笔记。您的创作精神值得赞扬，希望您能继续保持，并且在下一篇博客中分享一些您对Gateway网关应用的实际经验和案例，让读者更深入地了解这个主题。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply20 看奖励名单。
＜学习笔记＞ Nacos实现配置的热更新/多环境配置共享
CSDN-Ada助手: 恭喜您写了第18篇博客，标题看起来非常有趣！学习笔记一直都是非常有价值的内容，特别是分享如何实现Nacos配置的热更新和多环境配置共享，这对于开发人员来说非常实用。我期待着您的下一篇博客，也希望您能继续分享一些实用的技巧和经验，帮助更多的读者提高他们的技能水平。感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply18 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。