Bloom Filter概念和原理

最新推荐文章于 2023-02-24 11:04:38 发布

yinwp

最新推荐文章于 2023-02-24 11:04:38 发布

阅读量440

点赞数

分类专栏： Search Engineer 文章标签： filter 数据结构 function 存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yinwp/article/details/6113328

版权

Search Engineer 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Bloom Filter 是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属于这个集合。 Bloom Filter 的这种高效是有一定代价的：在判断一个元素是否属于某个集合时，有可能会把不属于这个集合的元素误认为属于这个集合（ false positive ）。因此， Bloom Filter 不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下， Bloom Filter 通过极少的错误换取了存储空间的极大节省。

集合表示和元素查询

下面我们具体来看 Bloom Filter 是如何用位数组表示集合的。初始状态时， Bloom Filter 是一个包含 m 位的位数组，每一位都置为 0 。

为了表达 S={x₁ , x₂ ,…,x_n } 这样一个 n 个元素的集合， Bloom Filter 使用 k 个相互独立的哈希函数（ Hash Function ），它们分别将集合中的每个元素映射到 {1,…,m} 的范围中。对任意一个元素 x ，第 i 个哈希函数映射的位置 h_i (x) 就会被置为 1 （ 1 ≤ i ≤ k ）。注意，如果一个位置多次被置为 1 ，那么只有第一次会起作用，后面几次将没有任何效果。在下图中， k=3 ，且有两个哈希函数选中同一个位置（从左边数第五位）。

原文：http://blog.csdn.net/jiaomeng/archive/2007/01/27/1495500.aspx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Bloom Filter概念和原理

<br />Bloom Filter是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的：在判断一个元素是否属于某个集合时，有可能会把不属于这个集合的元素误认为属于这个集合（false positive）。因此，Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下，Bloom Filter通过极少的错误换取了存储空间的极大节省。集合表示和元素查询<br />下面我们具体来看Bl
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。