布隆过滤器的实现（c++）

最新推荐文章于 2024-04-28 21:55:45 发布

y1054765649

最新推荐文章于 2024-04-28 21:55:45 发布

阅读量2.9k

点赞数 1

分类专栏：数据结构与算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/y1054765649/article/details/88712339

版权

简要介绍一下布隆过滤器：

如果想要判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。链表，树等等数据结构都是这种思路. 但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢(O(n),O(logn))。不过世界上还有一种叫作散列表（又叫哈希表，Hash table）的数据结构。它可以通过一个Hash函数将一个元素映射成一个位阵列（Bit array）中的一个点。这样一来，我们只要看看这个点是不是1就可以知道集合中有没有它了。这就是布隆过滤器的基本思想。（摘自百度百科）

实现：

1.计算需要的哈希函数个数k及需要申请的内存长度m（m是二进制长度，申请时可以申请（（m/32）+1 个int 类型），

2.将文件中的每一个样本经k个哈希函数求得k个哈希值，并对每一个哈希值取模（哈希值%m），并将申请的内存中对应位置1（如果本来是1，则不改变），

3.判断某样本是否存在，只需重复第二步，根据哈希函数计算每一个哈希值，取模并看内存

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
5
评论
布隆过滤器的实现（c++）

简要介绍一下布隆过滤器：如果想要判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。链表，树等等数据结构都是这种思路. 但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢(O(n),O(logn))。不过世界上还有一种叫作散列表（又叫哈希表，Hash table）的数据结构。它可以通过一个Hash函数将一个元素映射成一个位阵列（Bit arr...
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。