利用Murmurhash实现Bloom filter（布隆过滤器）

最新推荐文章于 2024-02-28 15:30:29 发布

yxc135

最新推荐文章于 2024-02-28 15:30:29 发布

阅读量5.3k

点赞数

分类专栏：算法文章标签： Bloom filter 布隆过滤器 murmurhash

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yxc135/article/details/8886720

版权

本文介绍了如何使用Murmurhash来实现布隆过滤器，包括确定过滤器大小、哈希函数个数及设计哈希函数的步骤。Murmurhash是一种优秀的哈希函数，可以通过改变seed值生成不同版本的哈希函数，避免冲突。文章还提到了种子值的作用，以防止潜在的DoS攻击，并推荐了一篇深入探讨布隆过滤器性能和扩展性的文章。

摘要由CSDN通过智能技术生成

关于布隆过滤器的介绍网上有很多，但都没有涉及具体如何实现，尤其是最后的k个相互独立的哈希函数如何实现。

具体实现步骤如下：

（关于布隆过滤器的介绍和相关证明，维基百科是看过的最好的：http://en.wikipedia.org/wiki/Bloom_filter ）

（1）确定过滤器大小：

假设我们要处理的数据总数是N，可以容忍的错误率是P，那么我们首先需要确定出过滤器的slot数 M = -N*lnP/(ln2)^2。有了M我们就可以声明过滤器数组了。

（2）确定哈希函数个数：

通过上一步的M，我们可以求得哈希函数个数 K = M/N*ln2 。

（3）设计哈希函数：

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yxc135 CSDN认证博客专家 CSDN认证企业博客

码龄13年

33: 原创

17万+: 周排名

227万+: 总排名

56万+: 访问

: 等级

4988: 积分

107: 粉丝

99: 获赞

76: 评论

226: 收藏

私信

关注

热门文章

分类专栏

JVM 14篇
并行计算 15篇
操作系统 20篇
Java 8篇
算法 18篇
Linux 7篇
C++ 7篇
网络 3篇
Python 10篇
杂记 9篇
随笔 2篇

最新评论

Decorator in Pyhton
github_35526155: 在加红字部分有点误人子弟了，，fib = memorize(fib) 执行后实际上全局域里面的fib重新关联到了装饰函数里面的helper了，所以递归调用的时候也会进入helper函数进行缓存的读取
关闭中断过程中是否会发生中断丢失
SSDDWSS: 应该是造成中断丢失吧。试想一个进程处于用户态，发生了中断，中断处理返回后一定还是从内核态进入用户态。那如果在处理中断的这些内核程序它也有中断，是内核中断。因为是关中断，所以无法响应它。试想如果现在处理完去响应这个内核中断的话，此时你的PLV显示的是用户态，怎么可能响应内核中断。你这里说的中断应该是指进程运行在用户态下的中断或者是内核态下这种单一的中断吧，如果两种状态切换，怎么运行啊？
中断向量表和中断描述符表IDT
hahajiajun: 牛逼，十分感谢大哥！
C语言实现读取FAT12文件系统
gavin546: 草，操作系统作业十年没变过了
GC日志分析
菜鸡一个，多多指教: ~来至2021年7月8号的评论。谢谢大佬，受教了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。