布隆过滤器

最新推荐文章于 2023-12-14 08:45:00 发布

Gxbalunn

最新推荐文章于 2023-12-14 08:45:00 发布

阅读量83

点赞数 1

文章标签：过滤器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45636230/article/details/118881430

版权

布隆过滤器是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列映射函数。布隆过滤器可以用来检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般算法要好得多，缺点是有一定的误识别率和删除困难。

如果要判断一个元素是不是在一个集合中，一般想到的是将所有的元素保存起来，然后通过比较确定。链表，树等数据结构都是这种思路。但随着集合中元素的增加，我们需要的存储空间越来越大，检索速度越来越慢。

散列表（又称哈希表）可以通过一个Hash函数讲一个元素映射成一个位阵列中的一个点。这样一来，我们只需要看这个点是否为1就可知道该元素在集合中是否存在。这时布隆过滤器的基本思想。

算法：

首先需要n个hash函数，每个函数可以把key散列为1个整数。
初始化时，需要一个长度为k比特的数组，每个比特位初始化为0.
某个key加入集合时，用n个hash函数计算出n个散列值，并把数组中对应的比特位设为1.
判断某个key是否在集合中，用n个hash函数计算出n个散列值，并查询数组中对应的比特位，如果所有的比特位都是1，则认为key在该集合中。

布隆过滤器数据结构

布隆过滤器是由一个固定大小的二进制向量或位图和一系列映射函数组成的。

在初始状态时，对于长度为m的位数组，它的所在为都设为0，如图：

当有元素被加入集合中时，通过n个哈希数将这个变量映射成位图中的n个点，把它们设为1。

查询某个变量的时候，我们只需看这些点是否都是1，会可以大概率知道集合中有没有它了。

如果这些点有任何一个0，则该变量一定不存在。
如果都是1，则该变量很可能存在

为什么说可能存在？因为映射函数本身就是散列函数，散列函数是会有碰撞的。

优点：不需要存储key，节省空间。

缺点：

算法判断key在集合中时，有一定概率误识别。
无法删除

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
布隆过滤器

布隆过滤器是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列映射函数。布隆过滤器可以用来检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般算法要好得多，缺点是有一定的误识别率和删除困难。如果要判断一个元素是不是在一个集合中，一般想到的是将所有的元素保存起来，然后通过比较确定。链表，树等数据结构都是这种思路。但随着集合中元素的增加，我们需要的存储空间越来越大，检索速度越来越慢。散列表（又称哈希表）可以通过一个Hash函数讲一个元素映射成一个位阵列中的一个点。这样一来，我们只需
复制链接

扫一扫

Gxbalunn CSDN认证博客专家 CSDN认证企业博客

码龄5年

38: 原创

9万+: 周排名

72万+: 总排名

1万+: 访问

: 等级

543: 积分

379: 粉丝

72: 获赞

26: 评论

75: 收藏

私信

关注

热门文章

分类专栏

postgresql 1篇
Redis 1篇
mysql高级 6篇
并发编程 1篇
设计模式 2篇
Nginx 1篇
Linux 1篇
干货 1篇
jvm 3篇
javase
正则表达式
笔记 1篇
javaScript 1篇
java 2篇
JavaWeb 3篇
Jquery 1篇

最新评论

PostgreSQL快速入门
22考研上岸: 学到知识了，希望博主日更！
JVM结构--类加载
抓手: 不错本来准备自己总结一下啊，比我的全面
JVM结构--类加载
雨developer: 给大佬递茶，翻起我牌，到我博客空间逛逛!
JVM结构--类加载
龚厂长: 感谢博主分享，楼主写的真好，学习到了
JVM结构--类加载
不正经的kimol君: TQL，大大大佬

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。